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Prefácio 


Álgebra Linear é o estudo dos espaços vetoriais e das transformações 
lineares entre eles. Quando os espaços têm dimensões finitas, as 
transformações lineares possuem matrizes. Também possuem ma¬ 
trizes as formas bilineares e, mais particularmente, as formas qua¬ 
dráticas. Assim a Álgebra Linear, além de vetores e transformações 
lineares, lida também com matrizes e formas quadráticas. São nu¬ 
merosas e bastante variadas as situações, em Matemática e em suas 
aplicações, onde esses objetos ocorrem. Daí a importância central da 
Álgebra Linear no ensino da Matemática. 

O presente livro apresenta uma exposição introdutória de Álge¬ 
bra Linear. Ele não pressupõe conhecimentos anteriores sobre o as¬ 
sunto. Entretanto convém lembrar que a posição natural de um tal 
curso no currículo universitário vem após um semestre (pelo menos) 
de Geometria Analítica a duas e três dimensões, durante o qual o 
estudante deve adquirir alguma familiaridade, em nível elementar, 
com a representação algébrica de idéias geométricas e vice-versa. 

Tornou-se quase obrigatório, já faz alguns anos, dedicar as pri¬ 
meiras sessenta ou mais páginas de todo livro de Álgebra Linear ao 
estudo dos sistemas de equações lineares pelo método da eliminação 
gaussiana, motivando assim a introdução das matrizes e dos deter¬ 
minantes. Somente depois disso são definidos os espaços vetoriais. 

Esse costume não é seguido neste livro, cuja primeira sentença 
é a definição de espaço vetorial. Mencionarei três razões para isso: 
(a) A definição de Álgebra Linear dada acima; (b) Não vejo vantagem 
em longas motivações; (c) Sistemas lineares são entendidos mais in¬ 
teligentemente depois que já se conhecem os conceitos básicos de 
Álgebra Linear. De resto, esses conceitos (núcleo, imagem, base, 
posto, subespaço, etc), quando estudados independentemente, têm 
muitas outras aplicações. 


O método da eliminação gaussiana é apresentado na Seção 9 e 
retomado na Seção 17. Ele é aplicado para obter respostas a vários 
outros problemas além da resolução de sistemas lineares. 

O livro é dividido em vinte e duas seções. As oito primeiras de¬ 
senvolvem os conceitos fundamentais e as proposições básicas, que 
formam a linguagem mínima necessária para falar inteligentemente 
sobre Álgebra Linear. A nona seção faz a primeira aplicação dessas 
idéias, tratando da eliminação gaussiana. 

A partir da Seção 10, os espaços dispõem de produto interno, 
o que possibilita o emprego de evocativas noções geométricas como 
perpendicularismo, comprimento, distância, etc. São destacados 
tipos particulares de operadores lineares, cujas propriedades 
especiais são demonstradas nas Seções 13, 14 e 15. O Teorema 
Espectral para operadores auto-adjuntos é provado na Seção 13, 
onde se demonstra também o Teorema dos Valores Singulares 
(Teorema 13.10), cuja grande utilidade não corresponde à sua cons¬ 
pícua ausência na maioria dos textos elementares. 

Outro assunto igualmente importante e igualmente esquecido 
no ensino da Álgebra Linear é a pseudo-inversa, que expomos na 
Seção 16. Trata-se de um tópico fácil, atraente, de grande apelo 
geométrico, que constitui um bom campo de aplicação para os con¬ 
ceitos anteriormente estudados. 

A Seção 17 é um interlúdio matricial, onde se mostra como as 
propriedades das transformações lineares estudadas antes se tradu¬ 
zem imediatamente em fatos não-triviais sobre matrizes, principal¬ 
mente algumas decomposições de grande utilidade nas computações. 

As formas bilineares e quadráticas são estudadas na Seção 18, 
onde é estabelecida a correspondência fundamental (isomorfismo) 
entre formas e operadores (Teorema 18.2) e provado o Teorema dos 
Eixos Principais (Teorema 18.3), que é a versão do Teorema Espec¬ 
tral para formas quadráticas. E ainda exposto o método de Lagrange 
para reduzir uma forma quadrática a uma soma (ou diferença) de 
quadrados e é feito um estudo das superfícies quádricas. 

Os determinantes são estudados na Seção 19, onde se define di¬ 
retamente o determinante de um operador sem recurso a bases nem 
matrizes. Em seguida, o determinante de uma matriz n x n é ca¬ 
racterizado como a única função n-linear alternada de suas colunas 
(ou linhas) que assume o valor 1 na matriz unitária. A colocação dos 


determinantes quase no final do livro, depois de já terem sido es¬ 
tabelecidos os resultados principais da Álgebra Linear e ensinados 
os métodos mais eficientes para resolver sistemas, inverter matri¬ 
zes etc, é uma atitude deliberada, que visa pôr esse conceito em seu 
devido lugar. Trata-se de uma noção de grande importância teórica, 
indispensável em várias áreas da Matemática, a qual foi, e ainda 
não deixou inteiramente de ser, equivocadamente considerada como 
instrumento computacional. Usar a Regra de Cramer para resolver 
um sistema linear, ou calcular o determinante de um operador para 
ver se ele é invertível ou não, são métodos que funcionam bem no 
caso 2 x 2, e até mesmo 3x3, mas se tornam altamente inviáveis a 
partir daí. 

Depois que se têm os determinantes, o polinómio característico é 
estudado na Seção 20. Esse estudo se completa na Seção 21 com a 
introdução dos espaços vetoriais complexos, nos quais vale o notável 
fato de que todo operador possui autovetores, logo pode ser triangu- 
larizado. Este resultado é devidamente explorado, o que concede a 
esta seção um ar de happy ending para a teoria, mas não o fim do 
livro. 

A seção final, número 22, apresenta uma breve exposição das 
equações a diferenças finitas, essencialmente limitada às equações 
(e sistemas) lineares de segunda ordem. Basicamente, trata-se de 
obter métodos eficazes de calcular as potências sucessivas de um 
operador ou de suas matrizes. 

Esta introdução à Álgebra Linear reflete uma longa experiência 
como usuário do assunto e, nos últimos dez anos, como professor. 
Ao escrevê-la, fui influenciado pelas reações dos meus alunos, suas 
participações nas aulas e suas palavras de incentivo. Um agradeci¬ 
mento especial por esse motivo é devido aos estudantes da E.RG.E. 
da Fundação Getúlio Vargas. Agradeço ao meu colega Jonas de Mi¬ 
randa Gomes por me ter convencido de que ainda havia lugar para 
mais um livro nesta área e por suas sugestões, sempre objetivas, que 
contribuíram para melhorar a comunicabilidade. Agradeço também 
a Wilson L. de Góes pela incrível eficiência e grande boa vontade na 
preparação do manuscrito. 


Rio de Janeiro, maio de 1995 
Elon Lages Lima 


Prefácio da Segunda Edição 

A boa acolhida dispensada à primeira edição, esgotada rapidamente, 
animou-me a fazer nesta algumas modificações, que enumero a se¬ 
guir. 

Foi feita uma extensa revisão do texto, eliminando-se vários 
erros de impressão, exercícios incorretamente propostos e trechos 
obscuros ou imprecisos. Para este trabalho, vali-me da colaboração 
de diversos leitores, dentre os quais destaco, de modo muito especial, 
o Professor Florêncio Guimarães, que elaborou uma lista minuciosa 
de correções. A todos esses amigos registro meus sinceros agradeci¬ 
mentos. 

O número de exercícios foi consideravelmente aumentado com a 
inclusão, em especial, de mais problemas elementares de natureza 
computacional, visando fazer com que os leitores menos experientes 
ganhem confiança em si ao lidarem com assuntos novos. 

A Seção 15 foi inteiramente reescrita, passando a tratar dos ope¬ 
radores normais em espaços vetoriais reais, um assunto fácil, atra¬ 
ente e muitas vezes negligenciado. A antiga Seção 15 (operadores 
anti-simétricos) tornou-se um mero caso particular. Sem esforço 
(nem espaço) adicional, o tratamento ganhou uma abrangência bem 
maior. 

Atendendo a vários pedidos, acrescentei ao livro um Apêndice 
sobre a forma canônica de Jordan, tratando esse tema de modo sim¬ 
ples, não apenas sob o ponto de vista matricial mas formulando-o 
também sob o aspecto de operadores. 

Rio de Janeiro, setembro de 1996 
Elon Lages Lima 

Prefácio da Oitava Edição 

Esta edição, além de conter novas correções sugeridas pela atenta 
vigilância do Professor Florêncio Guimarães, deu-me oportunidade 
de acrescentar à lista de indicações bibliográficas o livro do Professor 
Ralph Costa Teixeira, que traz as soluções de todos os exercícios aqui 
propostos. 

Rio de Janeiro, outubro de 2009 
Elon Lages Lima 
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Espaços Vetoriais 


A noção de espaço vetorial é a base do estudo que faremos; é o terreno 
onde se desenvolve toda a Álgebra Linear. Esta seção apresenta os 
axiomas de espaço vetorial, deduz suas conseqüências mais imedia¬ 
tas e exibe os exemplos mais importantes dessa noção. 

Um espaço vetorial E é um conjunto, cujos elementos são chama¬ 
dos vetores, no qual estão definidas duas operações: a adição, que a 
cada par de vetores u, v e E faz corresponder um novo vetor u+v e E, 
chamado a soma de u e v, e a multiplicação por um número real, que 
a cada número «eRea cada vetor v e E faz corresponder um vetor 
a • v, ou av, chamado o produto de a por v. Essas operações devem 
satisfazer, para quaisquer a, (3 £ R e u, v, w £ E, as condições abaixo, 
chamadas os axiomas de espaço vetorial: 

comutatividade: u + v = v + u; 

associatividade: (u + v)+w = u+(v + w) e (a|3 )v = a( |3v); 

vetor nulo: existe um vetor 0 € E, chamado vetor nulo, ou vetor 
zero, tal que v + 0 = 0 + v = v para todo v £ E; 

inverso aditivo: para cada vetor v £ E existe um vetor —v £ E, 
chamado o inverso aditivo, ou o simétrico de v, tal que —v + v = 

V + (—v) = 0; 

distributividade: (a + |3)v = av + |3v e a(u + v) = au+ av; 

multiplicação por 1: 1 • v = v. 


2 Espaços Vetoriais 


Seção 1 


Observação: O mesmo símbolo 0 representa o vetor nulo e o núme¬ 
ro zero. 

Exemplo 1.1. Para todo número natural n, o símbolo R n representa 
o espaço vetorial euclidiano n-dimensional. Os elementos de R n são 
as listas ordenadas u = (<xi,..a n ), v = ((3 1 ,..., |3 n ) de números 
reais. 

Por definição, a igualdade vetorial u = v significa as n igualdades 
numéricas ai = (3 1 ,..., cx n = |3 n . 

Os números ai,..., a n são chamados as coordenadas do vetor u. 
As operações do espaço vetorial R n são definidas pondo 


U + V = (a! + |3i, . . Otn + |3n), 
a • u = (ao ci, ..., aa n ). 

O vetor zero é, por definição, aquele cujas coordenadas são todas 
iguais a zero: 0 = (0,0,..., 0). 

O inverso aditivo de u = (ai,...,a n ) é —u = (—ai,..., — a n ). 
Verifica-se, sem dificuldade, que estas definições fazem de R n um 
espaço vetorial. Para n = 1, tem-se R 1 = R = reta numérica. R 2 é o 
plano euclidiano e R 3 é o espaço euclidiano tridimensional da nossa 
experiência cotidiana. 

Para ajudar a compreensão, os vetores de R 2 e R 3 podem ser re¬ 
presentados por flechas com origem no mesmo ponto O. A soma u+v 
é a flecha que liga a origem O ao vértice que lhe é oposto no parale¬ 
logramo que tem u e v como lados. (Veja Figura 1.1.) 



Figura 1.1 - Soma de vetores. 
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Por sua vez, o produto au é a flecha colinear a u, de comprimento 
oí vezes o comprimento de u, com o mesmo sentido de u se a > 0 e 
com sentido oposto se a < 0. 

Exemplo 1.2. Os elementos do espaço vetorial M°° são as seqüências 
infinitas u = (oq,..., oc n ,...), v = (|3i,..., |3 n ,...) de números reais. 
O elemento zero de M°° é a seqüência 0 = (0,..., 0,...), formada por 
infinitos zeros, e o inverso aditivo da seqüência u = (oq,..., oc n ,...) 
é —u = (—oq,..., — cx n ,...). As operações de adição e multiplicação 
por um número real são definidas por 

U + V = (oq + pi,..oc n + (3 n ,...), 
oc ■ u = (ocoq,..., ococ n ,...). 


Exemplo 1.3. Uma matriz (real) m x n a = [aq] é uma lista de 
números reais aq com índices duplos, onde 1 < i < m e 1 < j < n. 
Costuma-se representar a matriz a como um quadro numérico com 
m linhas e n colunas, no qual o elemento aq situa-se no cruzamento 
da i-ésima linha com a j-ésima coluna: 


an 

ai2 • • 

<Ün 

a 21 

0-22 • • 

Ü2n 

Q-ml 

^m2 

Qmn 


O vetor (au, a^,..., ai n ) € M n é o i-ésimo vetor-linha da matriz a e 
o vetor (aq, a 2 j,..., a m j) € é o j-ésimo vetor-coluna de a. Quando 
m = n, diz-se que a é uma matriz quadrada. O conjunto M(mxn) de 
todas as matrizes m x n torna-se um espaço vetorial quando nele se 
define a soma das matrizes a = [aq] e b = [bq] como a+b = [aq +bq] 
e o produto da matriz a pelo número real oc como oca = [ctaq]. A 
matriz nula O e M(m x n) é aquela formada por zeros e o inverso 
aditivo da matriz a = [aq] é —a = [— aq]. 


Exemplo 1.4. Seja X um conjunto não-vazio qualquer. O símbolo 
.F(X;R) representa o conjunto de todas as funções reais f, g: X —> K. 
Ele se torna um espaço vetorial quando se definem a soma f + g de 
duas funções e o produto a • f do número oc pela função f da maneira 
natural: 


(f + g)M = f(x) + gM, (af)(x) = oc• f(x). 
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Variando o conjunto X, obtêm-se diversos exemplos de espaços 
vetoriais da forma .F(X;M). Por exemplo, se X = então 

.F(X;R) = M n ; se X = N então .F(X;M) = M°°; se X é o produto carte¬ 
siano dos conjuntos {1,... ,m} e {1,... ,n} então ,F(X;M) = M(m x n). 

Outros exemplos de espaços vetoriais ocorrem como subespaços, 
como veremos a seguir. 

Valem num espaço vetorial, como conseqüências dos axiomas, as 
regras operacionais habitualmente usadas nas manipulações numé¬ 
ricas. Vejamos algumas delas. 

1. Se w + u = w + v então u = v. Em particular, w + u = w implica 
u = 0ew + u = 0 implica u = —w. 

Com efeito, da igualdade w + u = w + v segue-se que 

u = 0 + u = (—■w + w) + u 
= —w + (w + u) 

= —w + (w + v) 

= (—•w + w) + V 
= 0 + v = V. 

Em particular, w + u = w implica w + u = w + 0, logo u = 0. E se 
w + u = 0 então w + u = w + (—w) logo u = —w. 

2. Dados OeKeveE tem-se 0 • v = 0 e E. Analogamente, dados 
cteReOeE, vale a • 0 = 0. 

Com efeito, v + 0-v = 1 -v + O-v = (1 +0) -v = 1 -v = v, logo 0-v = 0 
como vimos acima. De modo análogo, como a-O+a-O = a-(0+0) = cx-0, 
segue-se de 1) que a • 0 = 0. 

3. Sea/Oev/0 então <x ■ v / 0. 

Com efeito, se fosse a • v = 0 então v = 1 • v = (cxr 1 • cx)v = 
ar 1 • (av) = ar 1 -0 = 0, isto é, teríamos v = 0. 

4. (-1) - v = -v. 

Com efeito, 

v + (—1) • v = 1 • v + (—1) ‘ v — (1 + (—1)) • v = 0 • v = 0, 

logo (—1 )v = —v, pela regra 1. 

No que se segue, escreveremos u — v para significar u + (—v). 
Evidentemente, 


u — v = w<t4u = v + w. 


Seção 1 
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Exemplo 1.5. Sejam u = (a, b) e v = (c, d) vetores em M 2 com 
u / 0, isto é, a / 0 ou b / 0. A fim de que v seja múltiplo de u, 
isto é, v = oai para algum a € M, é necessário e suficiente que se 
tenha ad — bc = 0. A necessidade é imediata pois v = au significa 
c = aa e d = ab. Multiplicando a primeira destas igualdades por 
b e a segunda por a obtemos bc = aab e ad = aab, logo ad = bc, 
ou seja, ad — bc = 0. Reciprocamente, se ad = bc então, supondo 
a / 0, obtemos d = (c/a)b. Além disso, é claro que c = (c/a)a. Logo, 
pondo a = c/a, vem d = ab e c = aa,. isto é v = au. Se for b / 0, 
tomaremos a = d/b para ter v = au. 


Exercícios 


2 3 0 

-2 -3 1 


L 12 13 1 ' 

(a) Calcule a matriz 3a — 2b + c. 

(b) Ache números a e |3, ambos diferentes de zero, tais que aa+|3b+c 
tenha a primeira coluna nula. 

1.2. Mostre que as operações definidas no texto fazem realmente dos 
conjuntos M n , M(m x n) e ,F(X;M) espaços vetoriais. 

1.3. Ache o valor de t que torna a matriz abaixo igual à matriz nula: 

V-1 t 2 -t ■ 

t 3 - 1 t 2 - 3t + 2 • 

1.4. Determine os vetores u,v e M 4 sabendo que as coordenadas de 
u são todas iguais, a última coordenada de v é igual a 3 e u + v = 
( 1 , 2 , 3 , 4 ). 

1.5. Dados u = (1,2,3), v = (3,2,0) e w = (2,0,0), ache números a, |3 
e y tais que au + |3v + yw = (1,1,1). 


1.1. Dadas as matrizes 


1 -1 2 

3 2-1 


, b 


-4 -8 4 
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1.6. Dados os vetores vi = (1,2,1), V 2 = (2,1,2), V 3 = (3,3,2) e 
V 4 = (1,5,—1) em M 3 , determine os vetores u = vi — 3 v 2 + 2 v 3 — V 4 , 
v = vi + V 2 — V 3 — V 4 e w = V 3 — jV 2 — 3 V 1 . 

1.7. Considere a seguinte afirmação: “Num espaço vetorial E existe 
um único vetor nulo e cada elemento de E possui um único inverso”. 
Qual fato demonstrado nesta seção assegura que esta afirmação é 
verdadeira? 

1.8. Use os axiomas do espaço vetorial E para provar que, seveEe 
n é um número natural então u-v = v + -- -+ v(u parcelas). 

1.9. Sejam u, v vetores não-nulos do espaço vetorial E. Prove que v é 
múltiplo de u se, e somente se, u é múltiplo de v. Que se pode dizer 
caso não suponhamos u e v ambos diferentes de zero? 

1.10. Sejam u = (xi,... ,x n ) e v = (yi,... ,y n ) vetores em M n . Prove 
que um deles é múltiplo do outro se, e somente se, x+y = Xj y, para 
quaisquer i, j = 1 ,..., n. 

1.11. Use as relações 2(u + v) = 2u + 2v, 2w = w + w para provar 
que a comutatividade u + v = v + u pode ser demonstrada a partir 
dos demais axiomas de espaço vetorial. 

1.12. Em M 2 , mantenhamos a definição do produto cxv de um número 
por um vetor mas modifiquemos, de 3 maneiras diferentes, a defini¬ 
ção da soma u + v dos vetores u = (x,y) e v = (x',y'). Em cada 
tentativa, dizer quais axiomas de espaço vetorial continuam válidos 
e quais são violados: 

( 1 ) u + v = (x + y',x'+ y); 

( 2 ) u + v = (xx',yy'); 

(3) u + v = (3x + 3x',5x + 5x'). 

1.13. Defina a média u * v entre dois vetores u, v no espaço vetorial 
E pondo u * v = ju + \v. Prove que (u * v) * w = u * (v * w) se, e 
somente se, u = w. 

1.14. Dados os espaços vetoriais Ei, E 2 , considere 0 conjunto E = 
Ei x E 2 (produto cartesiano de Ei por E 2 ), cujos elementos são os 
pares ordenados v = (vi,V 2 ), com vi £ Ei e V 2 £ E 2 . Defina operações 
que tornem E um espaço vetorial. Verifique a validez de cada um 
dos axiomas e mostre que sua definição se estende para 0 caso de 
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n espaços vetoriais Ei,..., E n , ou mesmo de uma seqüência infinita 
) p 2 > • • • ) E n , .... 

1.15. Sejam X um conjunto qualquer e E um espaço vetorial. Mos¬ 
tre que, com as definições naturais, o conjunto J^X-.E) das funções 
f: X —> E se torna um espaço vetorial. Identifique os casos particu¬ 
lares em que X = {1,..., n}, X = N, X = A x B, onde A = {1,..., m} e 
B = {1,..., n}. 

1.16. Dados os vetores u = (1,2,3), v = (3,2,1) e w = (—3,2,7) em 
M 3 , obtenha números a, (3 tais que w = au+ |3v. Quantas soluções 
admite este problema? 

1.17. Sejam u = (1,1), v = (1,2) e w = (2,1). Ache números a, b, c, 
a', b', c', todos não-nulos, tais que au + bv + cw = a'u + b'v + c'w, 
com a' / a, b' / b, c' / c. 

1.18. Sejam E um espaço vetorial e u,v E E. O segmento de reta de 
extremidades u, v é, por definição, o conjunto 

[u, v] = {(1 — t)u + tv; 0 < t < 1 ). 

Um conjunto XcE chama-se convexo quando u,v E X => [u,v] C X. 
(Ou seja: o segmento de reta que liga dois pontos quaisquer de X 
está contido em X.) Prove: 

(a) A interseção Xi n ... n X m de conjuntos convexos X],..., X m c Eé 
um conjunto convexo. 

(b) Dados a, b,c E M, o conjunto X = {(x,y) E M 2 ; ax + by < c} é 
convexo em M 2 . 

(c) O conjunto Y = {(x,y,z) € M 3 ; a < x < b, c<y<d}é convexo 
em M 3 . 

(d) Seja XcE convexo. Se r, s, t são números reais > 0 tais que 
r + s + t = 1 então u, v, w E X => ru + sv + tw E X. 

(e) Generalizando o resultado acima, a expressão tivi + • • • + Uv^, 
onde ti,..., tk são > 0 e Q + • • • + U = 1 chama-se uma combinação 
convexa dos vetores vi,... ,Vk. Se o conjunto XcEé convexo, prove 
que toda combinação convexa de vetores vi,..., v k e X ainda per¬ 
tence a X. 

1.19. Prove que o disco D = {(x,y) E M 2 ;x 2 + y 2 < 1} é um conjunto 


convexo. 
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1.20. Um subconjunto C do espaço vetorial E chama-se um cone 
quando, para todo veCe todo t > 0, tem-se tv e C. Prove: 

(a) O conjunto dos vetores v € M n que têm exatamente k coordenadas 
positivas (0 < k < n) é um cone. 

(b) O conjunto das funções f: X —> M que assumem valores negativos 
em todos os pontos de um subconjunto fixado Y c X é um cone em 

T{X;R). 

(c) Um cone C C E é um conjunto convexo se, e somente se, u,v e 

C = 7 * u -{“ v £ C. 

(d) A interseção e a reunião de uma família qualquer de cones são 
ainda cones. 

1.21. Dado um subconjunto X no espaço vetorial E, seja C(X) o con¬ 
junto das combinações convexas tiví + ■ • • + t^vic (ti > 0, Iti = 1) 
dos elementos de X. Prove que C(X) é um conjunto convexo, que 
X c C(X) e que se C é qualquer subconjunto convexo de E contendo 
X então C' D C(X). (Por este motivo, diz-se que C(X) é o menor 
subconjunto convexo de E que contém X. C(X) chama-se a envoltória 
convexa do conjunto X.) 


2 


Subespaços 


Um subespaço vetorial do espaço vetorial E é um subconjunto F c E 
que, relativamente às operações de E, é ainda um espaço vetorial. 
Os subespaços vetoriais constituem uma rica fonte de exemplos de 
espaços vetoriais, como se verá nas seções seguintes. 

Seja E um espaço vetorial. Um subespaço vetorial (ou simples¬ 
mente um subespaço ) de E é um subconjunto FcE com as seguintes 
propriedades: 

1. 0 € F; 

2. Se u, v e E então u + v € E; 

3. Se v € E então, para todo «ei, av € E. 

Segue-se que se u e v pertencem ao subespaço E e a, (3 são 
números reais quaisquer então <xu+ |3v € E. Mais geralmente, dados 
vi,..., v m € F e oq ,..., a m € R tem-se v = ctivi + • • • + a m v m € E. 

O conjunto {0}, com o único elemento 0, e o espaço inteiro E 
são exemplos triviais de subespaços de E. Todo subespaço é, em si 
mesmo, um espaço vetorial. 

Exemplo 2.1. Seja v € E um vetor não-nulo. O conjunto E = (av; a £ 
R} de todos os múltiplos de v é um subespaço vetorial de E, chamado 
a reta que passa pela origem e contém v. 

Exemplo 2.2. Seja E = o espaço vetorial das funções reais 

de uma variável real f: R —> R. Para cada k € N, o conjunto C k (R) 
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das funções k vezes continuamente deriváveis é um subespaço veto¬ 
rial de E. Também são subespaços de E o conjunto C°(R) das funções 
contínuas, o conjunto C°°(M) das funções infinitamente deriváveis, o 
conjunto V = P(M) dos polinómios p(x) = a Q + ai x + • • • + a n x n e o 
conjunto V n dos polinómios de grau < n. Para n, k € Áf quaisquer, 
tem-se: 


C°QR) D C k (M) D C k+1 (M) D C°°(M) D V D V n . 

Observe que o conjunto dos polinómios de grau n não é um subespaço 
vetorial de E pois a soma de dois polinómios de grau n pode ter 
grau < n. 

Exemplo 2.3. Sejam ai,...,a n números reais. O conjunto H de 
todos os vetores v = (xi,..., x n ) € M n tais que 

ai xt -I-1 - a n x n = 0 

é um subespaço vetorial de M n . No caso desinteressante em que 
ai = ■ ■ ■ = a n = 0, o subespaço H é todo o M n . Se, ao contrário, pelo 
menos um dos cq é ^ 0, H chama-se um hiperplano de M n que passa 
pela origem. 

Exemplo 2.4. Sejam E um espaço vetorial e L um conjunto de 
índices. Se, para cada À € L, f A é um subespaço vetorial de E então 
a interseção 

F=f|F* 

A6L 

é ainda um subespaço vetorial de E. Segue-se então do Exemplo 2.3 
que o conjunto dos vetores v = (xi,... ,x n ) € K n cujas coordenadas 
satisfazem as m condições abaixo 


<Ú1*1 + a n x 2 H - h ainXn = o 

<121*1 + <122*2 H-f Ü2n*n = 0 


<1iti1*1 T U m 2*2 T • • • + Q-mn*n — 0 

é um subespaço vetorial de R n , o qual é a interseção E = Ei n ... n E m 
dos hiperplanos definidos, segundo o Exemplo 2.3, por cada uma 
das equações acima. 
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Seja X um subconjunto do espaço vetorial E. O subespaço ve¬ 
torial de E gerado por X é, por definição, o conjunto de todas as 
combinações lineares 


cxivi + CX2V2 H-b a m v m 


de vetores G X. 

E fácil ver que o conjunto de todas as combinações lineares que 
se podem formar com vetores retirados do conjunto X é, de fato, um 
subespaço vetorial, que indicaremos pelo símbolo S(X). 

O subespaço S(X), gerado pelo subconjunto X c E, contém o con¬ 
junto X e, além disso, é o menor subespaço de E que contém X. Nou¬ 
tras palavras, se F é um subespaço vetorial de E e X c F então 
S(X) c F. Evidentemente, se X já é um subespaço vetorial, então 
S(X) = X. Quando o subespaço S(X) coincide com E, diz-se que X é 
um conjunto de geradores de E. 

Explicitamente: um conjunto X é um conjunto de geradores do 
espaço vetorial E quando todo vetor w e E pode exprimir-se como 
combinação linear 

w = aiVi -|-b a m v m 

de vetores vi,..., v m pertencentes a X. 

Exemplo 2.5. Se v € E é um vetor não-nulo, o subespaço gerado por 
v é a reta que passa pela origem e contém v. 

Exemplo 2.6. Sejam u = (a, b) e v = (c, d) vetores de M 2 tais que 
nenhum deles é múltiplo do outro. Então u / 0, v / 0 e, pelo Exem¬ 
plo 1.5, ad — bc / 0. Afirmamos que X = {u,v} é um conjunto de 
geradores de M 2 , ou seja, que qualquer vetor w = (r, s) € M 2 pode 
exprimir-se como uma combinação linear w = xu + yv. De fato esta 
igualdade vetorial em M 2 equivale às duas igualdades numéricas 

ax + cy = r 
bx + dy = s. 

Como ad — bc / o, o sistema de equações acima possui uma solução 
(x, y), logo existem x,y G R tais que xu + yv = w. Esta mesma con¬ 
clusão pode também ser obtida geometricamente, conforme mostra a 
Figura 2.1. A partir da ponta de w, traçam-se paralelas às retas que 
contêm u e v, determinando assim os múltiplos xu, yv, que somados 
dão w. 
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Figura 2.1. 


Exemplo 2.7. Os chamados vetores canônicos 


d = (1,0,0,...,0), 

e 2 = (0,1,0,..., 0), 
e n = (0,0,..., 0,1) 


constituem um conjunto de geradores do espaço M n . Com efeito, 
dado v = (<xi,..., a n ) € M n , tem-se v = <x-\e-\ + • • • + a n e n . Analo¬ 
gamente, os monómios 1, x, ..., x n ,... (em número infinito) formam 
um conjunto de geradores do espaço V dos polinómios reais. Por 
sua vez, os n + 1 primeiros deles, a saber, 1, x,..., x n constituem 
um conjunto de geradores de V n , espaço vetorial dos polinómios de 
grau < n. 

Resulta do Exemplo 2.6 que os únicos subespaços vetoriais de M 2 
são {0}, as retas que passam pela origem e o próprio M 2 . Com efeito, 
seja F c M 2 um subespaço vetorial. Se F contém apenas o vetor 
nulo, então F = {0}. Se F contém algum vetor u / 0 então há duas 
possibilidades: ou todos os demais vetores de F são múltiplos de u, e 
neste caso F é a reta que passa pela origem e contém u, ou então F 
contém, além de u, um outro vetor v que não é múltiplo de u. Neste 
caso, F contém todas as combinações lineares xu + yv, logo F = M 2 , 
pelo Exemplo 2.6. 
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Exemplo 2.8. O sistema linear de m equações a n incógnitas 

miX! + a 12 X 2 H-b ainXn = b] 

o- 2 ixi + a 22 x 2 H-b a 2n x n = b 2 


O-rrilXl “b O m2 X 2 + • • • + QmuXn — b m 

possui uma solução (xi,...,x n ) se, e somente se, o vetor b = (bi, 
..., b m ) é combinação linear dos vetores-coluna 

v i = (on, a 2 i,..., a m i), 

= (oin> 0 2n , . . . , O mTl ) 


da matriz a = [ay]. Com efeito, estas equações significam que 

b = xivi + x 2 v 2 H-b x n v n . 

Em particular, se os vetores-coluna vi,..., v n gerarem M m , o sistema 
possui solução, seja qual for o segundo membro b. 

Sejam Ei e E 2 subespaços vetoriais de E. O subespaço vetorial de 
E gerado pela reunião Fi U F 2 é, como se vê facilmente, o conjunto de 
todas as somas vi + v 2 , onde vi € Fi e v 2 € F 2 . Ele é representado 
pelo símbolo Fi + F 2 . 

Mais geralmente, dados os subconjuntos X, Y c E, indica-se com 
X + Y o conjunto cujos elementos são as somas u + v, onde u e X e 
v € Y. Quando X = {u} reduz-se a um único elemento u, escreve-se 
u + Y em vez de {u} + Y. Diz-se então que u + Y resulta de Y pela 
translação de u. 

Quando os subespaços Ei,E 2 c E têm em comum apenas o ele¬ 
mento {0}, escreve-se Ei © E 2 em vez de Fi + E 2 e diz-se que F = Fi © E 2 
é a soma direta de Fi e E 2 . 

Teorema 2.1. Sejam E, Fp F 2 subespaços vetoriais de E, com E] c Ee 
E 2 c E. As seguintes afirmações são equivalentes-. 


(1) E = Ei © F 2 ; 
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(2) Todo elemento w € F se escreve, de modo único, como soma 
w = vi + V 2 , onde vi G Fi e v 2 G F 2 . 


Demonstração: Provemos que (1) => (2). Para isto, suponhamos 
que Fi n F 2 = {0} e que se tenha ui + u 2 = vi + v 2 , com ui , vi G e 
U 2 ,V 2 G F 2 . Então ui — vi = V 2 — U 2 . Como ui — vi € Fi e V 2 — U 2 € F 2 , 
segue-se que ui — vi e V 2 - U 2 pertencem ambos a F] e a F 2 . Mas 
Fi n F 2 = {0}. Logo ui — vi = V 2 — U 2 = 0, ou seja, ui = vi e U 2 = v 2 . 
Para provar que (2) => (1), seja v € Fi n F 2 . Então 0 + v = v + 0 com 
0,v G Fi e v, 0 G F 2 . Pela hipótse (2), isto implica 0 = v, portanto 
Fi n F 2 = {0}. □ 

Exemplo 2.9. Em M 4 , sejam Fi 0 subespaço gerado pelos vetores 
ei = (1,0,0,0), e 2 = (0,0,1,0) e F 2 0 subespaço gerado pelos veto¬ 
res e 2 = (0,1,0,0), e 4 = (0,0,0,1). Então Fi é 0 conjunto dos ve¬ 
tores da forma (ai,0, 1 x 3 , 0 ) enquanto os vetores de F 2 têm a forma 
(0, CX 2 ,0, CX 4 ). É claro que M 4 = Fi © F 2 . 

A noção de subespaço vetorial abrange as retas, planos e seus 
análogos multidimensionais apenas nos casos em que esses conjun¬ 
tos contêm a origem. Para incluir retas, planos, etc. que não passam 
pela origem, tem-se a noção de variedade afim, que discutiremos 
agora. 

Seja E um espaço vetorial. Sex, yGEex/y,a reta que une os 
pontos x, y é, por definição 0 conjunto 

r = {(1 — t)x + ty;t G M). 

Pondo v = y — x, podemos ver que r = {x + tv; t G M}. 

Um subconjunto V C E chama-se uma variedade afim quando a 
reta que une dois pontos quaisquer de V está contida em V. Assim, 
V C E é uma variedade afim se, e somente se, cumpre a seguinte 
condição: 

x, y G V, t G R => (1 - t)x + ty G V. 

Exemplo 2.10. Um exemplo óbvio de variedade afim é um subespa¬ 
ço vetorial. Ao contrário dos subespaços vetoriais, que nunca são 
vazios pois devem conter 0 zero, a definição acima é formulada de 
tal modo que 0 conjunto vazio a cumpre, logo 0 é uma variedade 
afim. 
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Se Vi,..., V m c E são variedades afins então a interseção V = 
Vi n ... n V m é ainda uma variedade afim. Todo ponto p G E é uma 
variedade afim. 

Exemplo 2.11. Sejam cq,..., a n , b números reais. O conjunto El dos 
pontos x = (xi,..., x n ) G M n tais que 


ai xi -I-1- a n x n = b 

é uma variedade afim (que não contém a origem quando b / 0). Se 
os números ai não são todos nulos, H chama-se um hiperplano. Se 
ai = • • • = a n = 0, tem-se H = 0 quando b / 0 e H = R n quando 
b = 0. Mais geralmente, o conjunto das soluções de um sistema 
linear de m equações com n incógnitas (vide Exemplo 2.8) é uma 
variedade afim (eventualmente vazia), interseção das m variedades 
afins definidas pelas equações do sistema. 

O teorema a seguir mostra que toda variedade afim não-vazia V 
pode ser obtida transladando-se um subespaço vetorial E. Diz-se que 
E é o subespaço vetorial paralelo a V. 

Teorema 2.2. Seja V uma variedade afim não-vazia no espaço veto¬ 
rial E. Existe um único subespaço vetorial F C E tal que, para todo 
x G V tem-se 

V = x + E = (x + v; v G E}. 



Demonstração: Dado x G V, seja E o conjunto de todos os vetores 
v = y — x, onde y G V. Mostremos que E é um subespaço vetorial. E 
claro que 0 G E. Além disso, seaGtevGE então v = y — x, com 
y G V, logo 


av = <x(y — x) = [(1 — <x)x + ay] — x = z — x, 
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com z = (1 — a)x + ay € V. Portanto av 6 F. Finalmente, se v = y — x 
e v' = y' - x pertencem a F então 

z = jy + \y' € v > 

portanto z-xeF. Segue-se daí que a soma 

v + v 1 = y + y' — 2x = 2(z — x) 


pertence a F. 

Em seguida, mostremos que V = x + F. Com efeito, y € V => y = 
x + (y — x) com y — x € F, logo y € x + F. Assim, Vcx + F. Por outro 
lado, um elemento qualquer de x + F tem a forma x + (y — x), com 
y € V, logo é igual a y e daí x + F c V. 

Finalmente, se F e F são subespaços vetoriais de E, tais que x + 
F = x + F' para algum x e E, provemos que se tem F = F'. Com efeito, 
v<eF=>x + v<Ex + F=>x + v<Ex + F' =^>x + v = x + v'(v' € F') => 
v = v' => v € F'. Portanto FcF. Da mesma forma, vê-se que F' c F, 
o que conclui a demonstração. □ 

Exemplo 2.12. Vimos no exemplo 2.8 que o conjunto V das soluções 
de um sistema linear de m equações com n incógnitas é uma va¬ 
riedade afim. Supondo V / 0, tomemos xj e Ve chamemos de F 
o subespaço vetorial de M n formado pelas soluções do sistema ho¬ 
mogêneo correspondente (descrito no Exemplo 2.4; veja também a 
página 27). Tem-se V = xo + F. Diz-se então que “todas as soluções 
do sistema se obtêm somando uma solução particular com a solução 
geral do sistema homogêneo associado”. 


Exercícios 

2.1. Seja R(°°) o subconjunto de R°° formado pelas sequências v = 
(xi, X 2 ,..., x n ,...) que têm apenas um número finito de termos x n 
diferentes de zero. Mostre que R íoo) é um subespaço vetorial de R°° 
e que as seqüências que têm um único termo não-nulo constituem 
um conjunto de geradores para kF°°F 

2.2. Use o índice deste livro para localizar a definição de matriz 
triangular. Mostre que o conjunto Fj das matrizes triangulares in¬ 
feriores e o conjunto F 2 das matrizes triangulares superiores são 
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subespaços vetoriais de M(n x u), que M(n x n) = Fi + F 2 e que 
não se tem M(u x u) = Fi © F 2 . 

2.3. Seja E = .F(R;R). Para X C R qualquer, ponhamos 
N (X) = {cp € E ; cp(x) =0 para todo x € X}. Prove: 

(a) Para todo XcK,N(X)é um subespaço vetorial de E. 

(b) X C Y => N(Y) C N(X) 

(c) N(XUY) = N(X) n N(Y) 

(d) N(X) ={0}^X = R 

(e) N(XnY) = N(X) + N(Y) 

(f) N (X) © N (Y) = E <=> Y = R - X. 

2.4. No espaço vetorial E = .F(R;R) sejam: 

Fi = conjunto das funções f: R —» R que se anulam em todos os 
pontos do intervalo [0,1]; 

F 2 = conjunto das funções g: R —> R que se anulam em todos os 
pontos do intervalo [2,3]. 

Mostre que Fi e F 2 são subespaços vetoriais de E, que E = Fi + F 2 
e que não se tem E = Fi © F 2 . 

2.5. Considere os subespaços Fi,F 2 C R 3 assim definidos: F] é 0 
conjunto de todos os vetores v = (x, x, x) que têm as três coordenadas 
iguais e F 2 é 0 conjunto de todos os vetores w = (x,y,0) que têm a 
última coordenada igual a zero. Mostre que R 3 = Fi © F 2 . 

2.6. Dados u = (1,2) e v = (—1,2), sejam Fi e F 2 respectivamente 
as retas que passam pela origem em R 2 e contêm u e v. Mostre que 

R 2 = F] © F 2 . 

2.7. Sejam Fi = S(ui,vi) e F 2 = S(u 2 ,V 2 ) os subespaços de R 3 gerados 
pelos vetores ui = (0,1,—2), vi = (1,1,1), U 2 = (—1,0,3) e V 2 = 
(2, —1,0). Ache números ai, bi, ci e < 12 , b 2 , C 2 tais que se tenha: 

fi = {(x,y,z) €R 3 ;a 1 x + b,y+ C!Z = 0} 
h = {(x, y, z) € R 3 ; a 2 x + b 2 y + c 2 z = 0}. 

2.8. No exercício anterior, mostre que U 2 ^ Fi e que Fi + F 2 = R 3 . 
Exiba um vetor não nulo w e Fj n F 2 e conclua que não se tem R 3 = 
Fi © F 2 . 
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2.9. Prove que S(X) é a interseção de todos os subespaços vetoriais 
que contêm o conjunto X c E. 

2.10. Exiba três vetores u,v, w e M 3 com as seguintes propriedades: 
nenhum deles é múltiplo do outro, nenhuma das coordenadas é igual 
a zero e M 3 não é gerado por eles. 

2.11. Seja F o subespaço de M 3 gerado pelos vetores u = (1,1,1) e 
v = (1,— 1,— 1). Ache números a, b, c com a seguinte propriedade: 
um vetor w = (x, y, z) pertence a F se, e somente se, ax + by + cz = 0. 


2.12. Exprima o vetor (1, —3,10) como combinação linear dos vetores 

u = (1,0,0), v = (1,1,0) e w = (2,—3,5). 


2.13. Mostre que a matriz d = 
combinação linear das matrizes 


4 

-6 


-4 

16 


pode ser escrita como 



'1 2' 


'-1 2 ' 


' 1 -2 

a = 

3 4 

, b = 

3 -4 

e c = 

-3 4 


2.14. Assinale V(erdadeiro) ou F(also): 

( ) O vetor w = (1,—1,2) pertence ao subespaço gerado por u = 

(1,2,3) e v = (3,2,1). 

( ) Qualquer vetor em M 3 pode ser expresso como combinação li¬ 
near dos vetores u = (—5,3,2) e v = (3, —1,3). 

( ) SeXc YentãoS(X) C S(Y). 

( ) Se S(X) c S(Y) então X c Y. 

( ) Se uma variedade afim V c F contém o vetor zero então V é 
um subespaço vetorial de F. 


2.15. Quais dos seguintes subconjuntos são subespaços vetoriais? 

(a) O conjunto Xcl 3 formado pelos vetores v = (x,y,z) tais que 
z = 3x e x = 2y. 

(b) O conjunto Ycl 3 formado pelos vetores v = (x,y,z) tais que 
xy =0. 
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(c) O conjunto Z das matrizes 2x3 nas quais alguma coluna é 
formada por elementos iguais. 

(d) O conjunto F c .F(R;R) formado pelas funções f: R —> R tais 
que f (x + 1) = f (x) para todo xéI. 

(e) O conjunto LcR n dos vetores v = (x, 2x,..., ux), onde xeMé 
arbitrário. 

(f) O conjunto dos vetores veR 5 que têm duas ou mais coordena¬ 
das nulas. 

(g) O conjunto dos vetores de R 3 que têm pelo menos uma coorde¬ 
nada > 0. 

2.16. Exprima, em termos das operações num espaço vetorial E, uma 
condição para que u,v,w € E sejam colineares (isto é, pertençam a 
uma mesma reta, que pode conter ou não o vetor zero). 

2.17. Obtenha números a, b, c, d tais que a variedade afim (plano) 
de R 3 definida pela equação ax + by + cz = d contenha os pontos 

e, = (1,0,0), e 2 = (0,1,0) e e 3 = (0,0,1). 

2.18. Prove que, na definição de subespaço vetorial, a condição 
“0 € F” pode ser substituída por “F / 0”. 

2.19. Quais dos seguintes conjuntos são subespaços vetoriais? 

(a) O conjunto dos vetores de R n cujas coordenadas formam uma 
progressão aritmética. 

(b) Os vetores de R n cujas coordenadas formam uma progressão ge¬ 
ométrica. 

(c) Os vetores de R n cujas coordenadas formam uma progressão ari¬ 
tmética de razão fixada. 

(d) Os vetores de R n cujas coordenadas formam uma progressão ge¬ 
ométrica de razão fixada. 

(e) Os vetores de R n cujas primeiras k coordenadas são iguais. 

(f) Os vetores de R n que têm k coordenadas iguais. 

(g) As seqüências (x n ) e R°° tais que x n+2 — 3x n = x n+ i para todo n. 

(h) Os vetores (x,y) € R 2 tais que x 2 + 3x = y 2 + 3y. 

(i) As funções f € C°°(R) tais que f" — 2f + f = 0. 
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2.20. Sejam vi, vi, V 3 os vetores-linha e wi, W 2 , W 3 os vetores-coluna 
da matriz 

'1 2 3' 

4 5 6. 

7 8 9_ 

Verifique as relações V 3 = 2vi — vi, W 3 = 2 w 2 — wj. Exprima wi e 
w 2 como combinações lineares de vi e v 2 , e vice-versa. Conclua que 
os vetores-linha e os vetores-coluna da matriz dada geram 0 mesmo 
subespaço de M 3 . 

2.21. Dê exemplo de uma matriz 3x3 cujos vetores-linha geram um 
subespaço de M 3 diferente daquele gerado pelos vetores-coluna. 

2.22. Prove que a reunião de dois subespaços vetoriais de E é um 
subespaço vetorial se, e somente se, um deles estiver contido no ou¬ 
tro. 

2.23. A partir da definição, prove que, dados os números ai,..., a n , c, 
0 conjunto V dos vetores x = (xi,..., x n ) € M n tais que aixi + • • • + 
a n x n = c é um subespaço vetorial de R n se, e somente se, c = 0 . 
Prove a afirmação feita no texto de que V é uma variedade afim. 

2.24. Seja F um subespaço vetorial de E. Assinale V(erdadeiro) ou 
F(also): 

( ) Se u^f e então u + v^E; 

( ) Se u^F e a/0 então au ^ F. 

2.25. Diz-se que um subconjunto X de um espaço vetorial E é simé¬ 
trico quando v € X =F —v e X. Prove que um cone convexo simétrico 
e não-vazio é um subespaço vetorial de E. 

2.26. Dê exemplo de um cone convexo que não seja simétrico e um 
cone simétrico que não seja convexo. 

2.27. Uma matriz quadrada a = [aq] chama-se simétrica (respect. 
anti-simétrica) quando aq = aq (respect. aq = —Ujt) para todo i e 
todo j. Prove que 0 conjunto S das matrizes simétricas e 0 conjunto 
A das matrizes anti-simétricas n x n são subespaços vetoriais de 
M(u x u) e que se tem M(u x u) = S © A. 

2.28. Seja E = .F(R;R). Fixada g: R —> R, mostre que 0 conjunto F 
de todas as funções f: R —> R tais que f(g(x)) = f(x) é um subespaço 
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vetorial de E. Para qual função g tem-se F = conjunto das funções 
periódicas de período a? E se fosse g(f(x)) = f (x) ? Ou f(g(x)) = 
gW? 

2.29. Prove que o subespaço vetorial gerado por um cone convexo 
C C E é o conjunto das diferenças u — v, onde u, v e C. Conclua que 
o conjunto das funções f: X —* R que só assumem valores positivos é 
um conjunto de geradores de .F(X;R). 

2.30. Diz-se que uma função f: X —> Ré limitada quando existe 
k > 0 (dependendo de f) tal que |f (x)| < k para todo x e X. Prove que 
o conjunto das funções limitadas é um subespaço vetorial de .F(X;R), 
o qual é gerado pelas funções limitadas positivas. 

2.31. Um subespaço vetorial de M 3 gerado por dois vetores não-coli- 
neares u, v chama-se um plano. Use um argumento geométrico para 
provar que se o vetor weR 3 não pertence ao plano gerado por u e v 
então u, v e w geram M 3 . 

2.32. Mostre que o vetor b = (1,2,2) não é combinação linear dos 
vetores vi = (1,1,2) e vi = (1,2,1). A partir daí, formule um sistema 
linear de 3 equações com 2 incógnitas, que não possui solução e que 
tem o vetor b como segundo membro. 

2.33. Sejam Ei,..., E k c E subespaços vetoriais. Prove: 

(1) O subespaço gerado pela união Ei U.. .UE k é o conjunto FH-|-E k 

das somas xi H- 1 - x k , onde xi € E],..., x k € E k . 

(2) As seguintes afirmações são equivalentes: 

(a) Cada x € Ei + • • • + E k se escreve de modo único como soma 

x = xi 4-E x k . 

(b) Para cada j = 1,..., k tem-se EjC(EH -EEj_i+Ej+i-t-hf k ) — 

{0}. 

Quando uma das condições (a) ou (b) vale, escreve-se Ei © ■ ■ ■ © E k em 
vez de F] + • • • + E k e diz-se que este subespaço é a soma direta de 
Ei,...,E k . 

2.34. Seja E = Fi © E 2 = Gi © G 2 . Se F] c 61 e F 2 c G 2 , prove que 
F] = Gi e F 2 = G 2 - 
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2.35. Sejam E, F espaços vetoriais. Uma função f: E —> F chama-se 
par (respect. ímpar) quando f(—v) = f(v) (respect. f(—v) = —f(v)) 
para todo veE. Prove: 

(a) O conjunto A das funções pares e o conjunto B das funções ímpa¬ 
res são subespaços vetoriais de .F(E;F) (vide Exerc. 1.15) e vale 
JE(E;E) = A © B. 

(b) Além dos conjuntos A, dos polinómios pares, e B, dos polinómios 
ímpares, considere também o conjunto A' dos polinómios da forma 
p(x) = I<apc 21 que só contêm expoentes pares e o conjunto B' dos po¬ 
linómios da forma q(x)=Ia.iX 2l+1 , que só contêm expoentes ímpares. 
Prove que A' e B' são subespaços vetoriais do espaço V de todos os 
polinómios, que A' c A, B' c B e ? = A' ® B'. Conclua que A = A' e 
B = B'. 

2.36. Para todo n e N seja Q n o conjunto dos polinómios (de graus 
arbitrários) que são divisíveis por x n . Prove que Q n é um subespaço 
vetorial de V. Ache um subespaço F c V tal que V = F © Q n . 

2.37. Dado X c E, seja Y o conjunto obtido de X substituindo um 
dos seus elementos v por v + au, onde u € X e a € R. Prove que 
X e Y geram o mesmo subespaço vetorial de E. Conclua daí que os 
conjuntos {vi,..., V]J C E e {vi, V 2 —vi,..., v^—vi} C E geram o mesmo 
subespaço vetorial de E. 

2.38. Prove que a reunião de três subespaços vetoriais só pode ser 
um subespaço vetorial quando um deles contém os outros dois. 

2.39. Sejam Fi, E 2 subespaços vetoriais de E. Se existir algum a € E 
tal que a + Fi c F 2 , prove que Fi c F 2 . 

2.40. Seja V C E uma variedade afim. Dados vi,..., v m € Ve 
(Xi,..., a m € R com oq + • • • + a m = 1, prove que oq vi + • • • + <x m v m G V. 

2.41. Para todo subespaço vetorial E c R n , prove que existe um 
subespaço GcK n tal que R n = F © G. 

2.42. Verdadeiro ou falso? Para quaisquer subconjuntos X,Y c E 
tem-se 


S(XUY) = S(X) + S(Y), 
S(xnY) = S(X) nS(Y). 
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(A última das igualdades acima sugere uma pergunta: qual seria 
o subespaço vetorial gerado pelo conjunto vazio? A convenção mais 
conveniente é S(0) = {0}.) 

2.43. Dado o subconjunto não-vazio X do espaço vetorial E, a va¬ 
riedade afim gerada por X é, por definição, o conjunto V(X) de to¬ 
das as combinações lineares cqvi + • • • + <x n v n , com vi,... ,v n € Xe 
oq + • • • + <x n = 1. Prove que 

(a) V(X) é uma variedade afim; 

(b) Fixado qualquer v 0 € X, tem-se V(X) = vo + F, onde F é o 
subespaço vetorial de E gerado pelos vetores v — vq, onde véX. 


3 


Bases 


Os espaços vetoriais de dimensão finita, objetos centrais do nosso 
estudo, possuem uma estrutura algébrica extremamente simples, evi¬ 
denciada pelas idéias de base e dimensão, que apresentaremos agora. 
Uma vez fixada uma base num espaço vetorial de dimensão n, seus 
elementos são meramente combinações lineares dos n vetores básicos, 
com coeficientes univocamente determinados. Nesta seção, esses fatos 
serão estabelecidos e analisados em detalhe. 

Seja E um espaço vetorial. Diz-se que um conjunto XcEé line¬ 
armente independente (abreviadamente, L.I.) quando nenhum vetor 
v e X é combinação linear de outros elementos de X. Para evitar 
ambigüidade, no caso em que X = {v} consta de um único elemento 
v, diz-se que X é L.I., por definição, quando v f 0. Quando X é L.I., 
diz-se também que os elementos de X são vetores linearmente inde¬ 
pendentes. 

Quando o conjunto X é L.I. seus elementos são todos f 0, pois o 

vetor nulo é combinação linear de quaisquer outros: 0 = 0 • vi H-b 

0 • v m . (Se não há “outros”, X = {v}, v f 0.) 

Um critério extremamente útil para verificar a independência 
linear de um conjunto é dado pelo teorema abaixo. 

Teorema 3.1. Seja X um conjunto L.I. no espaço vetorial E. Se 
cq vi + • • • + a m v m =0 com ,..., v m € X então cq = • • • = a m =0. Re¬ 
ciprocamente, se a única combinação linear nula de vetores de X é 
aquela cujos coeficientes são todos iguais a zero, então X é um con¬ 
junto L.I.. 
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Demonstração: Suponhamos, por absurdo, que se tenha cqvH-b 

a m v m = 0 com vi,..., v m e X mas nem todos os cq sejam nulos. Por 
simplicidade, seja cq / 0. Então teremos vj = — (<X 2 /oq)v 2 — • • • — 
(a m /oq)v m = 0, 0 que exprime vi como combinação linear de outros 
elementos de X. Reciprocamente, se X não fosse L.I., algum dos seus 
vetores seria combinação linear dos demais: 

v = cqvi H-1- <x m v m , logo 1 • v — oqvi-a m v m = 0, 

uma combinação linear nula de vetores em X, na qual pelo menos 0 
primeiro coeficiente não é zero. □ 

Corolário. Sev = oqvi -I-b oc m v m = (3 1 vi H-1- (3 m v m e os vetores 

vi,... ,v m são L.I. então cq = (3i,..., <x m = |3 m . 

Com efeito, tem-se neste caso (cq — |3 1 )vi -I-b (ct m — |3 m )v m = 0 

logo ai - |3i = • • • = oc m - |3 m = 0. □ 

Evidentemente, todo subconjunto de um conjunto L.I. é 
ainda L.I.. 

Exemplo 3.1. Os vetores canônicos ei = (1,0,..., 0),..., e n = 
(0, ...,0,1) em M n são L.I.. Com efeito, cqei + • ■ • + a n e n = 0 
significa (cq,...,a n ) = 0, logo cq = • • ■ = <x n = 0. Analogamente, 

os monómios 1, x,..., x 11 em V n são L.I. pois a 0 + cq x H-h cx n x n = 

p(x) é o vetor nulo em P n somente quando p(x) é a função identi¬ 
camente nula, isto é, p(x) =0 para todo x € M. Isto obriga a ser 
ot 0 = ■■■ = oi n = 0 pois um polinómio não nulo de grau k tem no 
máximo k raízes reais. Esta observação nos permite ainda concluir 
que X = {1, x,..., x n ,...} C V é um conjunto infinito L.I.. 

Na prática, o critério seguinte é às vezes útil. 

Teorema 3.2. Sejam vi,...,v m vetores não-nulos do espaço veto¬ 
rial L. Se nenhum deles é combinação linear dos anteriores então o 
conjunto X = (vi,..., v m } é L.I.. 

Demonstração: Suponhamos, por absurdo, que uma combinação li¬ 
near dos vetores dados, com coeficientes não todos nulos, fosse igual 
a zero. Se ot T v r fosse a última parcela não-nula dessa combinação, 
teríamos então 


cqvi + • • • + cx T v T = 0, 
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com oír / 0. Daí viria v r = — v i — • • • — 1 v r _i, logo v r seria 

combinação linear dos elementos anteriores a ele na lista vi,..., v m . 
(Observe que r > 1 pois V] / 0.) □ 

Observação: Evidentemente, vale um resultado análogo, com “sub- 
seqüentes” em vez de “anteriores” no enunciado. 

Um conjunto X c E diz-se linearmente dependente (abreviada¬ 
mente, L.D.) quando não é L.I.. 

Isto significa que algum dos vetores v € X é combinação linear 
de outros elementos de X, ou então que X = {0}. A fim de que X seja 
L.D. é necessário e suficiente que exista uma combinação linear nula 

oq vi -\ -1- a m v m = 0 de vetores vi,..., v m € X com algum coeficiente 

oq / 0. Se X c Y e X é L.D. então Y também é L.D.. Se 0 € X então o 
conjunto X é L.D.. 

Exemplo 3.2. Os vetores u = (1,2,3), v = (4,5,6), w = (7,8,9) em 
M 3 são L.D. pois w = 2v — u. 

Exemplo 3.3. Quando os vetores vi,...,v m são L.D., isto não signi¬ 
fica que qualquer um deles seja combinação linear dos demais. Por 
exemplo se u = (1,2), v = (3,4) e w = (4,8) então {u,v,w} cl 2 é um 
conjunto L.D. pois w = 4u + 0 • v porém v não é combinação linear de 
u e w. 

Uma base de um espaço vetorial E é um conjunto 6cE linear¬ 
mente independente que gera E. Isto significa que todo vetor ve E 
se exprime, de modo único, como combinação linear vt@= oqvi + • • ■ + 
oc m v m de elementos vi,..., v m da base B. Se B = {vi,...,v m } é uma 
base de E e v = oqvi + • • • + a m v m , então os números oq,..., <x m 
chamam-se as coordenadas do vetor v na base B. 

Exemplo 3.4. Os vetores e-i = (1,0,..., 0),..., e n = (0,..., 0,1) cons¬ 
tituem uma base (ei,..., e n } de M n , chamada a base canônica. Ana¬ 
logamente, os monómios 1, x,..., x n formam uma base para o espaço 
vetorial V n dos polinómios de grau < n. O conjunto 

{l,x,...,x n ,...} 

dos monómios de graus arbitrários constitui uma base (infinita) para 
o espaço vetorial V de todos os polinómios reais. Convém obser¬ 
var, entretanto, que o conjunto X = {êi,..., e n ,...} C M°°, onde 
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ê n = ( 0 ,..., 0 , 1 , 0 ,...) é a seqüência infinita cujo n-ésimo termo é 
1 e os demais são iguais a zero, é um conjunto infinito L.I. mas 
não é uma base de M°° pois não gera este espaço. Com efeito, o 
subespaço vetorial de M°° gerado por X é o conjunto M^°°* formado 
pelas seqüências v = (oq,..., cx n ,...) nas quais apenas um número 
finito de coordenadas a n é / 0 . 

Demonstraremos a seguir que se um espaço vetorial E admite 
uma base com n elementos então todas as bases de E têm o mesmo 
número n de elementos. Este número é chamado a dimensão de E. 

O ponto de partida é o lema abaixo. Nele, um sistema linear é 
chamado homogêneo quando o segundo membro de cada equação é 
igual a zero. Todo sistema homogêneo admite pelo menos a solução 
trivial (0,0, Isto é coerente com o Exemplo 2.4, pois as so¬ 

luções v = (xi,...,x n ) de um sistema homogêneo constituem um 
subespaço vetorial de M n e todo subespaço contém o vetor nulo. 

Lema 3.1. Todo sistema linear homogêneo cujo número de incógni¬ 
tas é maior do que o número de equações admite uma solução não- 
trivial. 

Demonstração: Consideremos o sistema 

UnX! + U 12 X 2 H-+ ainXn = 0 

0-21X1 + a 2 2X 2 H-+ a 2 n x n = 0 


: (*) 
OmlXi + Qm2X2 "E ' ' ' T UrunXn = 0, 

de m equações com n incógnitas, onde m < n. Usaremos indução no 
número m de equações. Para m = 1, temos uma única equação 

onxi H-+ a ln x n = 0, 

com n > 1 incógnitas. Um dos coeficientes qu é / 0. Mudando os 
nomes das incógnitas, se necessário, podemos supor que ai n / 0. A 
equação dada equivale a 

ou , . oi n _ 

-X] H-1- 

Oln Oin 

Atribuindo arbitrariamente valores não-nulos às n — 1 incógnitas 
xi,... ,x n _i e calculando x n por meio desta última expressão, obte¬ 
mos uma solução não-trivial (xi,... ,x n ) para a equação dada. Para 
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completar a indução, suponhamos o lema verdadeiro para um sis¬ 
tema com m — 1 equações. Mudando, se necessário, a ordem das 
equações e os nomes das incógnitas, podemos admitir que, no sis¬ 
tema (*) dado, tem-se a mn / 0. Então da m-ésima equação resulta 


= - 


«ml . . 

-XH--I-X n _i 

Q-mn Q-mn 


Substituindo, em cada uma das m — 1 primeiras equações, a incógni¬ 
ta x n por este valor, obtemos um sistema homogêneo de m — 1 equa¬ 
ções nas u — 1 incógnitas xi,..., x n _i. Pela hipótese de indução, este 
sistema admite uma solução não-trivial (oq ,..., <x n -i), pois u — 1 > 
m — 1. Pondo 


«n 


O-mi 

Umn 


oq + 


. «mn—1 

H-a n _i 

Umn 


) 


obtemos uma solução não-trivial (oq,..., <x n _i, oc n ) do sistema pro¬ 
posto (*). □ 

Teorema 3.3. Se os vetores vi,..., v m geram o espaço vetorial E 
então qualquer conjunto com mais de m vetores em E é L.D. 

Demonstração: Dados os vetores uq,..., w n em E, com u > m, 

para cada j = 1 ,... ,n temos w, = oqjVi -I-1- a m jv m pois os vetores 

vi,...,v m geram E. Para mostrar que os vetores wj são L.D., deve¬ 
mos achar coeficientes xi,...,x n , não todos iguais a zero, tais que 
X]Wi + • • • + x n w n = 0. Substituindo os wj por suas expressões em 
termos dos vt, esta igualdade significa que 



v 2 H - b 


«j «m/j 


= 0 . 


Certamente esta última condição será satisfeita desde que todos os 
somatórios dentro dos parênteses sejam nulos, ou seja, que 
(xi,..., x n ) seja uma solução não-trivial do sistema homogêneo 


oqi*i + cq 2 x 2 -I-b cq n x n = 0 

«21 xi + a 22 x 2 -I-b <x 2n x n = 0 


«ml«1 “b «m2«2 “b • • • + «mn«n — 0* 
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Uma tal solução existe, pelo Lema 3.1, pois u > m. Logo wi,..., w n 
são L.D. e o teorema está demonstrado. □ 

Corolário 1. Se os vetores vi,...,v m geram o espaço vetorial E e os 
vetores ui,..., u n são L.I. então n < m. 

Este corolário é uma mera reformulação do Teorema 3.3. 

Corolário 2. Se o espaço vetorial E admite uma base B={u i,..., u n } 
com n elementos, qualquer outra base de E possui também u elemen¬ 
tos. 


Com efeito, seja B' = {vi,..., v m ) outra base de E. Como B' gera E 
e B é L.I., temos u < m, pelo Corolário 1. Como B gera EeB'é L.I., 
do mesmo corolário segue-se m < u. Logo m = n. □ 

Diz-se que o espaço vetorial E tem dimensão finita quando ad¬ 
mite uma base B = {vi,..., v n } com um número finito n de elemen¬ 
tos. Este número, que é o mesmo para todas as bases de E, chama-se 
a dimensão do espaço vetorial E: n = dim E. Por extensão, diz-se 
que o espaço vetorial E = {0} tem dimensão zero. 

Corolário 3. Se a dimensão de E é n, um conjunto com n vetores 
gera E se, e somente se, é L.I.. 

Com efeito, se X = {vi,..., v n ) gera E e não é L.I. então um dos 
seus elementos é combinação dos n — 1 restantes. Estes n — 1 veto¬ 
res formariam ainda um conjunto de geradores de E, em contradição 
com o Teorema 3.3, pois E contém (uma base com) n vetores line¬ 
armente independentes. Reciprocamente, suponhamos que X seja 
L.I.. Se X não gerasse E, existiria um vetor v e E que não seria 
combinação linear dos elementos de X. Então, pelo Teorema 3.2, 
(vi,..., v n , v) seria L.I., em contradição com o Teorema 3.3, pois uma 
base de E, com n elementos, gera o espaço. □ 

Como a base canônica (ei,..., e n } C M n tem n elementos, R n é um 
espaço vetorial de dimensão finita n. Segue-se então do Corolário 3 
que, para mostrarmos que n vetores vi,..., v n € M n formam uma 
base basta provarmos que eles são L.I. ou, alternativamente, que 
geram ]R n . 
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Teorema 3.4. Seja E um espaço vetorial de dimensão finita n. Então: 

(a) Todo conjunto X de geradores de E contém uma base. 

(b) Todo conjunto L.I. {vi,...,v m } c E está contido numa base. 

(c) Todo subespaço vetorial F c E tem dimensão finita, a qual é 
< n. 

(d) Se a dimensão do subespaço FcEé igual a n, então E = E. 

Demonstração: (a) Os conjuntos L.I. em E têm no máximo n 
elementos. Seja Y = {yi,...,v m } c X um subconjunto L.I. de X 
com o número máximo possível de elementos. Se existisse algum 
vetor v € X que não fosse combinação linear de vi,... ,v m então o 
conjunto {vi,..., v m , v) c X seria L.I. pelo Teorema 3.2, mas isto con¬ 
tradiria a maximalidade de m. Logo devemos ter X c S(Y), donde 
E = S(X) c S(Y) e daí S(Y) = E, ou seja Y é uma base de E, contida 
em X, como se devia demonstrar. 

(b) Seja 

Y = {v 1 ,...,v m ,v m+1 ,...,v k } 

um conjunto L.I. com o número máximo possível de elementos con¬ 
tendo os m vetores dados. (Pelo Teorema 3.3, tem-se k < u.) Se 
existisse em E algum vetor v que não fosse combinação linear dos 
elementos de Y, então Y U {v} seria um conjunto L.I., de acordo com 
o Teorema 3.2, em contradição com a maximalidade de k. Segue-se 
que Y gera E, logo é uma base de E, contendo vi,..., v m . 

(c) Seja Y = {vi,...,v m } c E um subconjunto de F que é L.I. e tem 
o número máximo possível de elementos. Então Y gera F pois se 
algum elemento v € F não fosse combinação linear dos vetores de Y 
então, pelo Teorema 3.2, (vi,... ,v m ,v} c F seria um conjunto L.I., 
contrariando a maximalidade de m. Portanto Y é uma base de F 
e F tem dimensão finita. Além disso, tem-se dim F = m < u pois 
nenhum conjunto com mais de n elementos em E pode ser L.I.. 

(d) Se dim F = dim E = n então toda base de F é um subconjunto 

L.I. com n elementos em E, logo gera E, pelo Corolário 3. Segue-se 
que F = E. □ 
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Neste livro, trataremos primordialmente dos espaços vetoriais 
de dimensão finita. Diz-se que o espaço vetorial E tem dimensão 
infinita quando ele não tem dimensão finita, isto é, quando nenhum 
subconjunto finito de E é uma base. Como todo subconjunto finito 
(que não se reduza ao vetor 0) contém um subconjunto L.I. que gera 
o mesmo subespaço, podemos dizer que um espaço vetorial E tem 
dimensão infinita se, e somente se, não é gerado por um conjunto 
finito de vetores. Por exemplo, o espaço V de todos os polinómios 
reais tem dimensão infinita pois se X c V é um conjunto finito de 
polinómios e r é o mais alto grau de um polinómio qualquer de X 
então o subespaço vetorial gerado por X está contido em V r , logo não 
é igual a V. 

Exemplo 3.5. Os monómios 1, x,..., x n constituem uma base do 
espaço vetorial V n , dos polinómios de grau < n, logo V n tem di¬ 
mensão finita e dim V n = n + 1 . Por outro lado, o conjunto infi¬ 
nito {1, x,..., x n ,...} é uma base do espaço vetorial V de todos os 
polinómios, o qual tem dimensão infinita. Também tem dimensão in¬ 
finita o espaço R(°°), introduzido no Exemplo 3.4, pois admite a base 
infinita {êi, Õ 2 ,..., ê n ,...}, onde ê n = ( 0 ,..., 0 , 1 , 0 ,...) é a seqüência 
infinita cujo n-ésimo termo é 1 e os demais são zeros. Finalmente, 
embora não exibamos explicitamente uma base para o espaço R°°, 
podemos assegurar que ele não tem dimensão finita, em virtude do 
item (c) do Teorema 3.4 acima, já que R(°°) é um subespaço de R°° 
com dimensão infinita. 

Exemplo 3.6. O espaço vetorial M(m x n), das matrizes m x n, tem 
dimensão finita, igual a m • n. Uma base para M(m x n) é formada 
pelas matrizes eq, cujo ij-ésimo elemento (na interseção da i-ésima 
linha com a j-ésima coluna) é igual a 1 e os demais elementos são 
iguais a zero. 

Exemplo 3.7. Se os coeficientes ai,..., a n não são todos iguais a 
zero, o hiperplano 


El = {(X! ,..., x n ) € R n ; qtxi 3-h a n x n = 0} 


é um subespaço vetorial de dimensão n — 1 em R n . Com efeito, ad¬ 
mitindo (por simplicidade) que a n / 0, vemos que 


V = (xi, . . . , X n ) G H 44 Xn =-X]- 

a n 
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Em particular, para todo i = 1,...,n — l,o vetor 

ví = (0, 0,-ai/a n ), 

cuja í-ésima coordenada é 1, a última é — cq/a n e as demais são zero, 
pertence a H. Além disso, os vetores vi,...,v n _| são L.I., como se 
vê facilmente. Logo o subespaço H tem dimensão n — 1 ou n. Como 
H (por exemplo, o vetor v = (0,..., 0, a n ) não pertence a H), 

segue-se que dim H = u — 1 e os vetores vi,..., v n _i formam uma 
base do hiperplano H. 

Diz-se que a variedade afim V c F tem dimensão r quando V = 
x + F, onde o subespaço vetorial F c E tem dimensão r. 


Exercícios 

3.1. Dados os vetores u = ( 0 . 1 , 0 . 2 , 113 ), v = (bi,b 2 ,b 3 ) e 

w = (c!,C 2 ,c 3 ), escreva u' = (a 1 ,o 2 ), v' = (b b b 2 ) e w' = (c l 5 c 2 ). 
Supondo u' e v' L.I., existem cx, (3 € M tais que W = ocu! + |3v'. Prove 
que {u,v, w} é L.D. se, e somente se, w = cxu + |3v (com os mesmos cx 
e (3). Use esse critério para determinar se os vetores u, v e w abaixo 
são L.I. ou L.D.: 


(a) 

u= (1,2,3), 

v = (1,3,2), 

w = (-1,2,3) 

(b) 

u= (1,2,3), 

v = (1,3,2), 

w-(l,4,l). 


3.2. Mostre que as matrizes a, b e c abaixo são L.I.: 



1 V 


'1 0 ' 


1 

r 

a = 

0 0 

> b = 

0 1 

, c = 

1 

1 


3.3. Prove que os polinómios seguintes são linearmente independen¬ 
tes: 

p(x) = x 3 — 5x 2 + 1, q(x) = 2x 4 + 5x — 6 , r(x) = x 2 — 5x + 2. 

3.4. Seja X um conjunto de polinómios. Se dois polinómios quaisquer 
pertencentes a X têm graus diferentes, prove que X é L.I.. 
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3.5. No espaço V 3 dos polinómios de grau < 3, verifique se os po¬ 
linómios abaixo são L.I. ou L.D.: 

p(x) = x 3 — 3x 2 + 5x + 1, 
q (x) = x 3 — x 2 + 6x + 2, 
r(x) = x 3 — 7x 2 + 4x. 


3.6. Se uma função em C°°(M) é combinação linear de outras então 
suas derivadas sucessivas são combinações lineares (com os mes¬ 
mos coeficientes) das derivadas dessas outras. Use este fato para 
mostrar que {e x , e 2x , x 3 , x 2 , x) é um conjunto L.I.. 

3.7. Seja E = Fi ® F 2 . Se B-\ é uma base de Fi e é uma base de F 2 , 
prove que B-\ U £>2 é uma base de F. 

3.8. Exiba uma base para cada um dos subespaços de M 4 listados a 
seguir: 


F = {(xi,x 2 ,x 3 ,x 4 );xi =x 2 =x 3 = x 4 } 

G ={(xi,x 2 ,x 3 ,x 4 );xi =x 2 ex 3 = x 4 } 

H = {(x 1 ,x 2 ,x 3 ,x 4 );x 1 =x 2 = x 3 } 

K = {(x 1 ,x 2 ,x 3 ,x 4 );x 1 +x 2 + x 3 + x 4 = 0}. 

3.9. Seja F um espaço vetorial de dimensão finita. Dado um subespa- 
ço F c E, prove que se pode obter um subespaço G C F tal que 
F = F © G. 

3.10. Seja F 0 subespaço vetorial (plano) de K 3 formado pelos vetores 
v = (x, y, z) tais que x — 2y + 4z = 0. Obtenha uma base (ui, U 2 , u 3 ) C 
M 3 tal que ui e U 2 pertençam a F. 

3.11. Mostre que os polinómios l,x—1 ex 2 —3x+l formam uma base 
de Vi ■ Exprima 0 polinómio 2x 2 — 5x + 6 como combinação linear dos 
elementos dessa base. 

3.12. Mostre que os vetores u = (1,1) e v = (—1,1) formam uma 
base de M 2 . Exprima cada um dos vetores ei = (1,0) e e 2 = (0,1) 
como combinação linear dos elementos dessa base. 
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3.13. Mostre que os vetores u = (1,1,1), v = (1,2,1) e w = (2,1, 2) 
são L.D.. 

3.14. Assinale V(erdadeiro) ou F(also) quanto à validez da afirmação: 
“A união de dois subconjuntos L.I. do espaço vetorial E é ainda 

um conjunto L.I.” 

( ) Sempre. 

( ) Nunca. 

( ) Quando um deles é disjunto do outro. 

( ) Quando um deles é parte do outro. 

( ) Quando um deles é disjunto do subespaço gerado pelo outro. 

( ) Quando o número de elementos de um deles mais o número de 
elementos do outro é igual à dimensão de E. 

3.15. Seja S o conjunto das matrizes simétricas u x n. Para cada 
par (i,j) de números naturais de 1 até u, com i < j, seja sq a matriz 
n x u cujos elementos nas posições ij e ji são iguais a 1 e os de¬ 
mais são zero. Prove que estas matrizes constituem uma base para 
o subespaço vetorial S C M(n x n). De modo análogo, obtenha uma 
base do subespaço A das matrizes anti-simétricas n x n. Conclua 
que dim S = n(n + 1 )/2 e dim A = u(u — 1 )/2. 

3.16. As matrizes t — [tq] € M(u x u) tais que tq = 0 quando i < j 
são chamadas triangulares inferiores. Prove que elas constituem 
um subespaço vetorial L c M(n x n), obtenha uma base para L e 
determine a sua dimensão. 

3.17. Obtenha uma base e conseqüentemente determine a dimensão 
de cada um dos subespaços de M(n x u) abaixo descritos: 

(a) matrizes cuja soma dos elementos da diagonal (traço) é zero. 

(b) matrizes que têm a primeira e a última linha iguais. 

(c) matrizes cuja segunda linha é igual à terceira coluna. 

(d) matrizes nas quais a soma dos elementos da primeira linha é 
igual à soma dos elementos da segunda coluna. 
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3.18. Sejam u,v € E vetores linearmente independentes. Dado a + 

0 , prove que o conjunto de dois elementos (v, v + au) é uma base do 
subespaço gerado pelos vetores v, v + u, v + 2 u,..., v + nu,_ 

3.19. Sejam vi = (1,2,... , n), V 2 = (n + l,n + 2,... ,2u),... ,v n = 
(n 2 —n+1, u 2 —n+2,..., u 2 ). Prove que estes vetores geram em M n o 
mesmo subespaço F que os vetores wi = (1 , u +1 , 2 n+l,..., n 2 — u +1 ), 
W 2 = (2,u+2,... ,ri 2 —n+2),..., w n = (n, 2n,... ,u 2 ) e que dim F = 2. 
(Veja Exercício 2.3.) 

3.20. Ache uma solução não-trivial para o sistema homogêneo: 

xi + 2 x2 + 3x3 + 4x4 = 0 

2 xi + X 2 + X 3 — X 4 = 0 

3xi — 2 x 2 + X 3 — 2 x 4 = 0 

e, a partir daí, obtenha uma combinação linear nula dos vetores vi = 
(1,2,3), v 2 = (2,1,-2), v 3 = (3,1,1), v 4 = (4,-1,-2), na qual os 
coeficientes não são todos iguais a zero. 

3.21. Seja {vi,..., v n } uma base do espaço vetorial E. Se os números 
ai,..., a n não são todos iguais a zero, prove que 0 conjunto F dos 
vetores v =* xivi + ■ ■ ■ + x n v n tais que cqxi + • • • + a n x n = 0 é um 
subespaço vetorial de E, com dim F = n — 1. 

3.22. Prove que {1, e x , e 2x , e 3x , e 4x ) é um conjunto L.I. no espaço 
C°°(R). (Sugestão: dada uma combinação linear nula, derive-a, de¬ 
pois divida por e x e prossiga.) 

3.23. Sejam Xi,..., X n ,... subconjuntos L.I. do espaço vetorial E. 

(a) Se X] C X 2 C ... C X n c X n+1 c ..., prove que X = (J X n é L.I.. 

(b) Se cada X n tem n elementos, prove que existe um conjunto line¬ 
armente independente X* = {xi,..., x n ,...} com x n € X n para cada 
n e N. 

(c) Supondo E = M (o °^ e admitindo as hipóteses dos itens anteriores, 
é verdade que X = (J X n seja uma base de E ? 

3.24. Se os vetores vi,... ,v m são L.I., prove que 0 mesmo se dá com 
os vetores vi, V 2 — vi,..., v m — vi. Vale a recíproca? 

3.25. Dado 0 conjunto finito X “ {ai,..., a n }, obtenha uma base para 
0 espaço vetorial V(X;M). 
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3.26. Seja X um conjunto infinito. Para cada a e X, seja f Q : X —> R 
a função tal que f Q (a) = 1 e f Q (x) = 0 se x / a. Prove que o conjunto 
Y C ,F(X;R) formado por estas funções é linearmente independente, 
logo .F(X;M) não tem dimensão finita. Prove ainda que Y não gera 

T{X;R). 

3.27. Sejam Ft , F 2 C E subespaços de dimensão finita. Obtenha uma 
base do subespaço Fi +F 2 que contenha uma base de Fi, uma base de 
F 2 e uma base de Fi n F 2 . 

3.28. Exiba uma base para cada um dos espaços vetoriais abaixo e 
daí calcule sua dimensão: 

(a) polinómios pares de grau < n. 

(b) polinómios ímpares de grau < n. 

(c) polinómios de grau < u que se anulam para x = 2 e x = 3. 

(d) vetores de M n (n > 6 ) nos quais a segunda, a quarta e a sexta 
coordenadas são iguais. 

3.29. Pode-se ter uma base de V n formada por u + 1 polinómios de 
grau u ? 

3.30. Mostre que os vetores u = (1,1,1), v = (1,2,3) ew = (1,4,9) 
formam uma base de M 3 . Exprima cada um dos vetores e -\, e 2 , e 3 da 
base canônica de M 3 como combinação linear de u, v e w. 

3.31. Ache uma seqüência infinita Fi, F 2 ,..., F n ,... de subespaços 
vetoriais de V tais que: (a) dim F n = 00 ; (b) F m n F n = {0} sem/n. 

3.32. Para 1 < i < m e 1 < j < n, sejam st, tj: M(m x n) —> M as 
funções definidas por st(a) = soma dos elementos da i-ésima linha 
de a e tj (a) = soma dos elementos da j-ésima coluna de a. Prove que 
si,..., s m ,ti,...,t n são L.D. no espaço vetorial E = ,F(M(m x n);M) 
mas 0 conjunto {si,..., s m _i, ti,..., t n } é L.I.. 

3.33. Com as notações do exercício anterior, sejam t, cr: M(nxn) —> 
M as funções definidas, para cada a = [at,] € M(n x n) por v(a) = 
an + • • • + a nn (soma dos termos da diagonal principal) e o(a) = 
ain. + a 2 ) n —1 + • • • + a n i (soma dos termos da outra diagonal). Prove 
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que, para n > 3, (si,..., s n _i, ti,..., t n , t, cr} são funções linearmente 
independentes. 

3.34. Num espaço vetorial E, diz-se que o vetor v é uma combinação 
afim dos vetores vi,...,v r quando se tem v = oqvi + • • • + a T v T , 
com oq + • • • + cx T = 1. Diz-se que os vetores vi,...,v r são afim- 
independentes quando nenhum deles é uma combinação afim dos 
demais. Prove que as seguintes afirmações são equivalentes: 

(1) Os vetores vi,... ,v r são afim-independentes. 

(2) Se oqvi -I-b cx r v r = 0 e oq -t-b cx T = 0 então oq = ■ ■ ■ = <x r = 0. 

r r 

(3) Se oqv! + • • • + a r v r = |3ivi + • • • + |3 T v T com Y. a i = H Pi então 

i=l i =1 

oq = (3 1 ,..., oi r = |3 r . (Em particular, duas combinações afins dos Vi 
só podem ser iguais quando tiverem os mesmos coeficientes.) 

(4) Os vetores V 2 — vi, V 3 — vi,..., v r — vi são L.I. . 

(5) A variedade afim gerada por vi,..., v T tem dimensão r — 1. 
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Transformações Lineares 

i 


A Álgebra Linear pode ser apresentada sob três pontos de vista equi¬ 
valentes: transformações lineares, matrizes ou formas quadráticas. 
A ênfase (ou até mesmo a exclusividade) que se dá a uma dessas 
abordagens é muitas vezes uma questão de hábito, gosto pessoal ou 
convicção. Neste livro, os três aspectos serão devidamente tratados 
porém a primazia será concedida às transformações lineares, pelos 
três motivos apontados, principalmente o último. 

Sejam E, E espaços vetoriais. Uma transformação linear A: E —> F 
é uma correspondência que associa a cada vetor v G E um vetor 
A(v) = A • v = Av G E de modo que valham, para quaisquer u,v G E 
e a G 1 , as relações: 


A(u + v) = Au + Av, 

A(a • v) = oc ■ Av. 

O vetor A v chama-se a imagem (ou o transformado ) de v pela trans¬ 
formação A. 

Se A: E —> F é uma transformação linear então A • 0 = 0. Com 
efeito, A • 0 = A(0 + 0) = A • 0 + A • 0. Além disso, dados u, v G E e 
a, |3 G R, tem-se A(au+ (3v) = A(au) + A(|3v) = a-Au+ |3 • Av. Mais 
geralmente, dados vi,..., v m em E e oq ,..., a m G M, vale 

A(ociVi H-h cx m v m ) = oí] ■ Avi -I-h a m • Av m . 


Daí resultam A(—v) = —Av e A(u — v) = Au — Av. 
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A soma de duas transformações lineares A,B:E-)Feo produto 
de uma transformação linear A: E —> F por um número a e R são 
as transformações lineares A + B: E —> Fe ocA: E —» F, definidas 
respectivamente por (A + B)v = Av + Bv e (aA)v = a ■ Av, para todo 
v € E. O símbolo 0 indica a transformação linear nula 0: E —> E, 
definida por 0 • v = 0 e, definindo —A: E —> E por (—A) • v = — Av, 
vê-se que (—A) + A = A + (—A) = 0. 

Seja C{ E; F) o conjunto das transformações lineares de E em E. As 
definições acima tornam £(E;E) um espaço vetorial. Quando E = E, 
usaremos a notação £(E) em vez de £(E;E). As transformações li¬ 
neares A: E —> E do espaço vetorial E em si mesmo são chamadas 
operadores lineares em E. Por sua vez, as transformações lineares 
cp: E —> R, com valores numéricos, são chamadas funcionais linea¬ 
res. Escreve-se E* em vez de £(E;M) e o conjunto E* dos funcionais 
lineares cp: E —> M chama-se o espaço vetorial dual de E. 

Um operador linear especial é o operador identidade I: E —> E, 
definido por I • v = v para todo v € E. Quando for necessário especifi¬ 
car, escreveremos U em vez de I. 

Uma transformação linear A: E —> E é um tipo particular de 
função que tem o espaço vetorial E como domínio e o espaço F como 
contra-domínio. Em geral, para se definir uma função f: X —> Y 
é necessário especificar o valor f(x) para cada elemento x no seu 
domínio X. O que torna as transformações lineares tão manejáveis 
é que, para se conhecer A e £(E;E), basta que se saibam os valores 
A • v que A assume nos vetores v € B, onde B é uma base de E. Isto 
é particularmente útil quando E tem dimensão finita. Neste caso, 
um número finito de valores A • vi,..., A • v n (onde {vi,..., v n } c E 
é uma base) atribuídos arbitrariamente, definem inteiramente uma 
transformação linear A: E —> E. Mais precisamente, vale o 

Teorema 4.1. Sejam E, F espaços vetoriais e B uma base de E. A 
cada vetor ué 8 , façamos corresponder (de maneira arbitrária) um 
vetor u' € E. Então existe uma única transformação linear A: E —> E 
tal que A • u = u' para cada u e B. 

Demonstração: Todo vetor v e E se exprime, de modo único, como 
uma combinação linear v = oq ui + • • • + a m u m de elementos ui,... 
..., u m da base B. Definimos A: E —> F pondo 

A • v = oquj H-E cx m u' m . 
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Dados v, w e E temos 


v = oqui H-1- a m u m 


e 


w = |3iui H-h |3 m u m . 


(Mesmo que a base B seja infinita, podemos exprimir v e w como 
combinações lineares dos mesmos elementos de B, completando com 
coeficientes zero os múltiplos dos ut que aparecem apenas numa das 
duas expressões.) Então 


m 



logo 


A(v + w) = L(oq + |3i)u[ = ZcXtuj + I|3tu( = A • v + A • w. 

De maneira análoga se vê que A(cxv) = <x • Av, portanto A: E —> E, 
assim definida, é uma transformação linear, tal que A • u = u', para 
todo u G B. Quanto à unicidade, seja B: E —> E outra transformação 
linear tal que B • u = u' para todo u e B. Então, para cada v = 
loqui e E tem-se 


B • v = B(Zcqtq) = Zoq • Bu^ = Zoq • u- = A • v 
portanto B = A. Isto completa a demonstração. 


□ 


Em virtude do Teorema 4.1, se quisermos definir uma transfor¬ 
mação linear A: M n —> M m basta escolher, para cada j = 1,..., n, 
um vetor v, = (aq, ci 2 j,..., a m j) € M m e dizer que v, = A • ej é a 
imagem do j-ésimo vetor da base canônica, e, = (0,..., 1,..., 0), pela 
transformação linear A. A partir daí, fica deter min ada a imagem 
A • v de qualquer vetor v = (xi,...,x n ) € M n . Com efeito, tem-se 
v - xiei -!-1- x n e n , logo 


A • v = A j ^ Xj ej 
\j=i 


( 


n 
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ou seja, 


A(xi,x 2 ,...,Xn) = (yi,y2,...,y,u), 


onde 


yi = anx! + a 12 x 2 -I-F ai n x n 

V2 = ci2ixi + a 22 x 2 -j -F a 2n x n 


l)in — “1“ ~F ' ' ' “F n mn X n . 


Resumindo: uma transformação linear A: R n —> R m fica intei¬ 
ramente determinada por uma matriz a = [ay] € M(m x n). Os 
vetores-coluna dessa matriz são as imagens A • ej dos vetores da 
base canônica de R n . A imagem A • v de um vetor arbitrário v = 
(xi,..., x n ) e I n é 0 vetor w = (y 1 ,..., y m ) € R m cujas coordenadas 
são dadas pelas equações (*) acima, nas quais ocorrem os vetores- 
linha da matriz a. Diz-se que a é a matriz da transformação A rela¬ 
tiva às bases canônicas de R n e R m . Tem-se 


m 



onde os ej estão em R n e os em R m . 

Em particular, a matriz de um funcional linear cp: R n —> R é do 
tipo 1 x n, logo pode ser escrita simplesmente como [ai, a 2 ,..., a n ], 
onde cy = cp(ej). Para todo vetor x = (xi,... ,x n ) € M n tem-se cp(x) = 
cqx-i H-b a n x n . 

Na situação dual, uma transformação linear A: R —f R n é dada 
por uma matriz n x 1, cuja única coluna é 0 vetor v = A ■ 1 = 
(ai,..., a n ). (A base canônica de R 1 = R tem um único elemento 
ei =1.) Assim, a transformação linear A: R —> R n fica inteira¬ 
mente determinada por um único vetor v G R n . Tem-se A • t = t • v 
para todo t € R. Evidentemente, 0 mesmo se pode dizer de toda 
transformação linear A: R —> F, seja qual for 0 espaço vetorial F: 
conhecendo v = A • 1 e F tem-se A • t = tv para todo t € R. 

Exemplo 4.1. Se dim E = 1, todo operador A: E —> E é do tipo 
A = <xl, isto é, existe uma constante a £ R tal que Av = cxv para 
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todo v G E. Com efeito, seja ueE um vetor não-nulo. Então {u} C E 
é uma base: todo vetor em E é múltiplo de u. Portanto existe a € R 
tal que Au = au. Para qualquer outro vetor v G E, temos v = Au 
portanto Av = A(Àu) = À Au = À au = a(Àu) = av. 

Exemplo 4.2. (Rotação de ângulo 0 em torno da origem em 

M 2 .) Trata-se do operador R: R 2 —> R 2 , que leva cada vetor v no vetor 
Rv que dele resulta pela rotação de ângulo 0 em torno da origem. A 
Fig. 4.1 deixa claro que R(u+v) = Ru+R-v. E bem mais claro ainda 
que R(av) = a • Rv para v G K 2 e a G R, logo R é uma transformação 
linear. Para um vetor v = (x,y) G R 2 arbitrário, seja R • v = (x',y'). 
Sabemos que x' = ax + by e y' = cx + dy e 



Figura 4.1 - Rotação de vetores. 


queremos determinar a matriz 


a b 
c dj ’ 

onde Re] = (a, c) e Re 2 = (b, d), com ei = (1,0) e e 2 = (0,1). 

Ora, pelas definições de seno e cosseno, o vetor unitário Rei, 
que forma com ei um ângulo 0, tem coordenadas cos0 e sen0, ou 
seja, Rei = (cos0,sen0). Além disso, como e 2 forma com ei um 
ângulo reto, Re 2 também forma com Rei um ângulo reto. Logo Re 2 = 
(—sen 0, cos 0). (Veja Fig. 4.2.) 
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Figura 4.2 - Rotação de ângulo 0. 


Portanto, a rotação R: M 2 —> R 2 leva um vetor v = (x, q) no vetor 
Rv = (x',y'), onde 


x' = xcos 0 — y sen0; 
y' = x sen 0 + y cos 0. 


A matriz de R relativa à base canônica de R 2 é 


cos 0 — sen 0 
sen 0 cos 0 


Exemplo 4.3. (Projeção ortogonal sobre uma reta.) A reta y = 
Qxéo conjunto dos pontos (x, ax) € M 2 , onde x varia em M. Ela é 
o subespaço vetorial de M 2 gerado pelo vetor (1, a). Consideremos 
o operador P: M 2 —> M 2 que faz corresponder a cada v = (x,y) € 
M 2 o vetor Pv = (x', ax'), cuja extremidade é o pé da perpendicular 
baixada de v sobre a reta y = ax. (Veja Fig. 4.3.) 
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Figura 4.3 - Projeção ortogonal sobre uma reta. 


Queremos determinar x' em função de x e y, o que nos dará as 
coordenadas (x', ax') de Pv em função das coordenadas de v. No caso 
particular em que a = 0, a reta y = ax é o eixo das abcissas e a 
projeção Pv é simplesmente igual a (x, 0). As equações da projeção P 
sobre o eixo horizontal são portanto x' = x, y' = 0. A matriz de P na 


base canônica de M 2 é 


1 0 ' 

0 0 


No caso geral, a extremidade do vetor 


Pv é o vértice do ângulo reto nu m triângulo retângulo cujos demais 
vértices são a origem e a extremidade do vetor v. Pelo teorema de 
Pitágoras, temos 


dist(v, O) 2 = dist(Pv, O) 2 + dist(v, Pv) 2 , 


ou seja, 

x 2 + y 2 = (x') 2 + a 2 (x') 2 + (x - x') 2 + (y - ax') 2 . 


Suponhamos x' / 0. Desenvolvendo, simplificando e dividindo am¬ 
bos os membros por x', obtemos (1 + a 2 )x' = x + ay, donde 


x = 


ay 


1 + a 


2 ’ 


ou seja x = 


1 4- a- 


■x + 




O caso x' = 0 significa que v = (x, y) está sobre a perpendicular à reta 
y = ax passando pela origem. Ora, a equação dessa perpendicular 
é x + ay =0, logo a expressão x' = (x + ay)/(l + a 2 ) fornece x' 
em função de x e y em todos os casos. Vemos, em particular, que 
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a projeção P: R 2 
canônica de R 2 é 


R 2 é um operador linear, cuja matriz na base 

1 Q ~ 

1+a 2 1+a 2 


1+a 2 


l+o 


Exemplo 4.4. (Reflexão em torno de uma reta.) Seja S : R 2 —> R 2 

a reflexão em torno da reta y = ax. Para todo v = (x,y) € R 2 , a reta 
y = ax é a bissetriz do ângulo entre v e Sv e é perpendicular à reta 
que liga v a Sv. Seja P: R 2 —> R 2 a projeção ortogonal sobre a reta 
y = ax. A Fig. 4.4 mostra que, para todo v € R 2 , tem-se v + Sv = 2Pv, 
ou seja, que I + S = 2P, onde I: R 2 —> R 2 é o operador identidade. Daí 
vem S = 2P — I. Usando o exemplo anterior, concluímos que, para 
todo v = (x,y), tem-se Sv = (x',y'), onde 


x 


/ 


1 — a 2 
1 + a 2 


x + 


2a 

1 + a 2 


y> 


2a 1 — a 2 

TT<? X ~ TTc? y 



Exemplo 4.5. Como vimos acima, o único tipo de funcional linear 

(p: R n —> R é o da forma cp(v)=aixi -|-ha n x n , para v = (xi,... ,x n ). 

Por outro lado, se E = C°([a, b]) é o espaço vetorial das funções 
contínuas f: [a, b] —* R, podemos definir o funcional linear cp: E —> R 
pondo 

rb 


<p(f) 


f (x) dx. 


J a 


Outro exemplo de funcional linear t, em E consiste em fixar um ponto 
c € [a, b] e definir, para cada f £ E, £,(f) = f(c). Ainda no contexto 
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do espaço de funções E = C°([a, b]), podemos definir um operador 
linear K: E —> E do seguinte modo: fixamos uma função contínua 
k: [a, b] x [a, b] —> R, de duas variáveis, e fazemos corresponder a 
cada f e E a função g = Kf e E dada por 


gW 


k(x,y)f(p) dy. 


a 


Finalmente, temos o importante operador de derivação D: C°°(R) —> 
C°°(R), definido por Df = f = derivada de f. Ele também pode ser 
considerado, de forma mais restrita, como um operador D: V n —> V n , 
onde 



ou, de forma mais ampla, como uma transformação linear 

D: C k (R)—> C k_1 (R), para k > 0. 


Exercícios 

4.1. Prove que se A,B: E —> E são transformações lineares e a é 
um número real então A + B e <xA, conforme definidas no texto, são 
transformações lineares. 

4.2. Sejam R, P, S: R 2 —> R 2 respectivamente a rotação de 30° em 
torno da origem, a projeção ortogonal sobre a reta y = x/3 e a re¬ 
flexão em torno da mesma reta. Dado o vetor v = (2,5), determine 
os vetores Rv, Pv e Sv. 

4.3. Assinale verdadeiro (V) ou falso (F): 

É dada uma transformação linear A: E —> F. 

( ) Se v £ E é tal que Av = 0 então v = 0. 

( ) Se Aw = Au + Av então w = u + v. 

( ) Se v é combinação linear de ui,..., u m então Av é combinação 
linear de Aui,..., Au m . 

( ) Se u, v, w € E são colineares (isto é, pertencentes a uma mesma 
reta) então Au, Av e Aw são colineares. 
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4.4. Seja A: R 2 —> R 2 a projeção sobre o eixo x, paralelamente à 
reta y = ax (a ^ 0). Isto significa que, para todo v = (x,y), tem- 
se Av = (x',0), tal que v — Av pertence à reta y = ax. Exprima x' 
em função de x e y e escreva a matriz de A relativamente à base 
canônica de R 2 . 

4.5. Dados os vetores ui = (2, —1), U 2 = (1,1), U 3 = (—1,-4), vi = 
(1,3), V 2 = (2,3) e V 3 = (—5, — 6 ), decida se existe ou não um operador 
linear A: R 2 —> R 2 tal que Aui = vi , AU 2 = V 2 e AU 3 = V 3 . Mesma 
pergunta com v 3 = (5, —6) e com v 3 = (5,6). 

4.6. A expressão geral de um operador linear A: R 2 —> R 2 é A(x,y) = 
(ax + by, cx + dy). Determine as constantes a, b, c e d de modo que 
A transforme os vetores u = (1,2) e v = (3,4) nos vetores Au = (1,1) 
e Av = (2,2). 

4.7. A expressão geral de um funcional linear f: R 3 —>R é f(x,y, z) = 
ax + by + cz. Dados os vetores u = (1,2,3), v = (—1,2,3) e w = 
( 1 ,- 2 ,3), determine a, b e c de tal modo que se tenha f(u) = 1 , 
f(v) = 0 e f (w) = 0 . 

4.8. Seja A: R 2 —> R 2 0 operador linear definido por A(x,y) = (5x + 
4y, —3x — 2y). Ache vetores não-nulos u = (x,y) e v = (s, t) tais que 
Au = u e Av = 2v. São únicas as soluções? Será possível achar w / 0 
em R 2 com Aw = ocw, onde <x / 1 ea/2? 

4.9. Dê as expressões dos funcionais lineares f, g,h: R 3 —> R que 
formam a base dual em (R 3 )* da base {u, v, w} c R 3 , onde u = (1,1,1), 
v = (1,— 1,1) e w = (1,1 — 1). (Vide Exercício 4.20.) 

4.10. Tem-se uma transformação linear A: R 2 —> R 3 . Sabe-se que 
A(—1,1) = (1,2,3) e A(2,3) = (1,1,1). Pede-se a matriz a e M(3 x 2) 
de A relativamente às bases canônicas de R 2 e R 3 . 

4.11. Prove que uma transformação linear A: E —> F transforma 
todo conjunto convexo C C E num conjunto convexo A(C) C F. 

4.12. Determine a expressão do operador linear A: R 2 —f R 2 , sa¬ 
bendo que, para todo v = (x,y), 0 segmento de reta que liga v a 
Av = (x',y') é horizontal e tem seu ponto médio sobre a reta y = x. 
Qual é a imagem do eixo vertical pelo operador A ? 

4.13. Prove que os operadores lineares Eu,E 12 ,E 21 ,E 22 : R 2 —> R 2 , 
definidos por En(x,y) = (x,0), Ei 2 (x,y) = (0,x), E 2 i(x,y) = (y,0), 
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E 22 foy) = (0,y), constituem uma base do espaço vetorial £(R 2 ). 
Prove ainda que outra base deste espaço pode ser formada com os 
operadores A, B, C, I, onde A(x,y) = (x + 3y,y), B(x,y) = (x,0), 
C(x,y) = (x + y,x-y) e I(x,y) = (x,y). 

4.14. Verifique que as funções definidas nos Exercícios 3.32 e 3.33 
são funcionais lineares. 


4.15. Seja A: E —> F uma transformação linear 

(a) Se os vetores Avi,..., Av m € F são L.I., prove que vi,..., v m € E 
também são L.I.. 

(b) Se F = E e os vetores Avi,..., Av m geram E, prove que vi,... ,v m 
geram E. 

(c) Valem as recíprocas de (a) e (b)? Seria (b) verdadeira com F / E ? 


4.16. Quais das transformações abaixo são lineares? 


(a) 

(b) 

(c) 

(d) 

(e) 

(f) 


A: R 3 -> R 3 , A(x,y, z) = [x,2y,2 z ). 

A: M 3 —> R 3 , A(x,y,z) = (3x, a,5z), onde a G R. 
A: R 4 —> R 3 , A(x,y, z, w) = (x — w,y — w,x + z). 
A: M(n x n) -> R n , A([ay]) = (an, a 22 ,..., a nn ). 


A: C°°(R) -» C°°(R), Af 
A: M(2 x 2) —> R, A ( Q 



-2f + 1. 


= ad — bc. 


4.17. Sejam A: E —> F uma transformação linear e E' c E, F' c F 
subespaços vetoriais. Prove que A(E') = {Av;v e E'} é um subespaço 
de F e A _ 1 (F') = (v G E;Av € F'} é um subespaço de E. Se V c E 
e W c F são variedades afins, prove que os conjuntos A(V) C F e 
A -1 (W) c E, definidos analogamente, são também variedades afins. 

4.18. No exercício anterior, prove que se E' tem dimensão finita 
então dim A(E') é finita e dim A(E') < dim E'. Dê um exemplo de 
um operador não identicamente nulo A: R 2 —* R 2 e um subespaço 
E' c R 2 tal que dim A(E') < dim E'. Prove também que se E e F têm 
dimensão finita e A é sobrejetiva então dim A -1 (F') > dim F'. Dê um 
exemplo em que A / 0 e dim A -1 (F') > dim F'. Dê também um exem¬ 
plo (com dim E = oo), onde dim F' é finita mas dim A -1 (F') = oo. 


4.19. Dados os espaços vetoriais E, F, prove que £(E;F) é um subes¬ 
paço vetorial de .F(E;F). (Vide Exercício 1.15.) 
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4.20. Seja V = {vi,...,v n } uma base do espaço vetorial E. Para 

cada i = 1,2, ...,n, seja f ^: E —> lo funcional linear determinado 
(conforme o Teorema 4.1) pelas condições ft(vi) = 1, ft(vj) = 0 se 
j / í. Prove que {fi,..., f n ) é uma base de E* = £(E;R) (chamada 
a base dual da base V). Mostre que se tem fi(v) = Xi para todo 
v = Xivi -I-1- x n v n E E. 

4.21. Seja f: R 2 —f R um funcional linear. Sabendo que f(l, 1) = 3 e 
f(2,3) = 1, calcule f(l, 0) e f(0,1). 

4.22. Seja A: M 2 —> M 2 o operador linear dado por A(x,y) = (ax + 
by, cx + dy), com ad — bc / 0. Prove: 

(1) Para todo v / 0 em R 2 , tem-se A.v / 0. 

(2) Toda reta R c R 2 (variedade afim de dimensão 1) é transfor¬ 
mada por A numa reta. 

(3) A transforma retas paralelas em retas paralelas. 

4.23. Determine a de modo que as retas perpendiculares em R 2 , de 
equações y = ax e y = —x/a sejam transformadas em retas per¬ 
pendiculares pelo operador linear A: R 2 —> R 2 , dado por A(x,y) = 
(2x + 3y, x — 2y). 

4.24. Sejam E, E espaços vetoriais de dimensão finita. Dados os 
vetores vi,..., v m E E e W],..., w m € E, a fim de que exista uma 
transformação linear A: E —> E com Avi = wi,...,Av m = w m , é 
necessário e suficiente que, para toda combinação linear nula aivi + 
• • • + a m v m = 0, se tenha também aiwj + • • • + a m w m = 0. 

4.25. Seja v um vetor não-nulo de um espaço vetorial E, de dimensão 
finita. Dado qualquer espaço vetorial E / {0}, mostre que existe uma 
transformação linear A: E —> E tal que Av / 0. 

4.26. Seja E um espaço vetorial de dimensão finita. Dada uma base 
T = (f i,..., f n } C E*, mostre que existe uma base (vi,..., v n } C E da 
qual T é dual. (Veja Exercício 4.20.) 

4.27. Seja Y um conjunto de geradores do espaço vetorial E. Se as 
transformações lineares A, B: E —> E são tais que Aw = Bw para todo 
w E Y, prove que Av = Bv para todo v E E. 
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4.28. Seja X = {vi,...,v m } um conjunto L.I. no espaço vetorial E, 
de dimensão finita. Dados arbitrariamente os vetores wi,..., w m no 
espaço vetorial F, prove que existe uma transformação linear A: E —> 
E tal que Avi = wi,..., Av m = w m . A é única se, e somente se, X é 
uma base de E. 

4.29. Uma transformação T: E —> E, entre espaços vetoriais, chama- 
se afim quando se tem T((1 —t)u+tv) = (1 —t)Tu+tTv para quaisquer 
u,veEeteM. Dada a transformação afim T: E —> E, prove: 

(a) Toda variedade afim V c E é transformada por T numa variedade 
afim V' c E. 

(b) Se T • 0 = 0, então, escrevendo av = (1 — a)0 + av, resulta que 
T(av) = a ■ Tv para quaisquer a € R, v € E. 

(c) Supondo ainda T • 0 = 0, a relação T Q(u + v)) = j(Tu + Tv), 
implica que T(u + v) = Tu + Tv para quaisquer u, v e E. 

(d) Para todo b € E, a transformação S: E —> E, definida por Sv = 
Tv + b também é afim. 

Conclua que T: E —> E é uma transformação afim se, e somente 
se, existem A € C[ E; E) e b e E tais que Tv = Av + b para todo v € E. 

4.30. Seja H c M n um subespaço vetorial de dimensão n — 1. 
Tome uma base V c H, formada pelos vetores vi,..., v n _i, onde 
ví = (ai,..., ai n ), i = 1,..., n — 1. Use o fato de que o sistema de 

n 

equações lineares Y. a ij x j = 0, com n— 1 equações e n incógnitas, ad- 

j=i 

mite uma solução não-trivial para concluir que existem n números 
ai,..., a n tais que v = (xi,..., x n ) pertence a H se, e somente se, 

aixi -E Qn.x n = 0. (Todo subespaço vetorial de M n com dimensão 

n — 1 é um hiperplano, isto é, é o conjunto das soluções de uma 
equação linear homogênea.) 


5 


Produto de 

Transformações Lineares 

/ 


O produto de transformações lineares, que introduziremos nesta 
seção, é um exemplo concreto de estrutura algébrica que apresenta 
variados e interessantes fenômenos, não encontrados nas operações 
entre números ou entre vetores. 

Dadas as transformações lineares A: E —> F, B: F —> G, onde o 
domínio de B coincide com o contra-domínio de A, define-se o produto 
BA: E —> G pondo, para cada v € E, (BA)v = B(Av), 


R 


A 



BA 


Vê-se imediatamente que BA é uma transformação linear. Ob- 
serve-se também que BA nada mais é do que a composta B o A das 
funções B e A. Segue-se então dos princípios gerais que se C: G —> H 
é outra transformação linear, vale a 
Associatividade: (CB)A = C(BA). 

A linearidade tampouco é necessária para mostrar que, dadas 
A: E —> F e B, C: F —> G, tem-se a 

Distributividade à esquerda: (B + C)A = BA + CA, que decorre 
simplesmente da definição de B + C. 

Usando a linearidade de C: F —> G, vê-se que, dadas A, B: E —> F, 
vale a 
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Distributividade à direita: C(A + B) = CA + CB. 

Com efeito, para todo veE, tem-se 

[C(A + B)]v = C[(A + B)v] = C(Av + Bv) = C(Av) + C(Bv) 
= (CA)v + (CB)v = (CA + CB)v. 


Exemplo 5.1. Sejam f, g,h: R —> R definidas por f(x) = x, g(x) = 
x + 1 e h(x) = x 2 . Então [h. o (f + g)](x) = 4x 2 + 4x + 1, enquanto 
[(h. of) + (hog)] (x) = 2x 2 + 2x + 1, logo ho(f+g) / hof + hog. Isto 
se dá porque h não é linear. 

Outra conseqüência da linearidade de B é a 
Homogeneidade: B(ocA) = «.(BA), válida para « e R, A: E —> F e 
B: F —> G quaisquer. 

Evidentemente, dada A: E —> F, tem-se AIe = A = IpA, de modo 
que as aplicações identidade 1^: E —> E, I F : F —> F são elementos 
neutros para a multiplicação, cada uma delas do lado apropriado. 

Diferenças notáveis entre o produto de transformações lineares 
e o produto de números reais são as ausências da comutatividade, 
da lei do corte e da inversa multiplicativa para uma transformação 
/ 0, além da presença de transformações nilpotentes, para as quais 
tem-se A n = 0 com A/0. Deve-se ainda mencionar a restrição de 
que o produto BA só está definido quando A toma valores no domínio 
de B. Esta restrição desaparece, naturalmente, quando se trata de 
operadores lineares no mesmo espaço F: então o produto BA está 
definido quaisquer que sejam A,B e £(F). 

Exemplo 5.2. Sejam P, R: M 2 —> M 2 respectivamente a projeção orto¬ 
gonal sobre a reta y = x e a rotação de um ângulo de 90° em torno da 
origem. Então, para todo v = (x,y) € M 2 , tem-se Pv = j(x + y,x + q), 
Rv = (—y,x). Segue-se que 

RPv = l(-x —q,x + y) 
e 

PRv = -(x — y, x — y). 

Portanto RPv / PR V para todo v, exceto para v = (0,0). Observe que 
bastaria que RPv / PRv para um único v a fim de termos RP / PR. 
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Exemplo 5.3. Seja P: M 2 —* R 2 a projeção ortogonal sobre uma certa 
reta r. Para todo v sobre a reta r, tem-se Pv = v. Assim, para qual¬ 
quer v G M 2 , tem-se PPv = Pv, pois Pv está sobre r. Noutras palavras, 
vale PP = P, ou seja PP = PI, embora P / 1. Assim, não é per¬ 
mitido cortar o fator P à esquerda em ambos os membros da igual¬ 
dade PP = PI. Segue-se que não existe Q € £(M 2 ) tal que QP = I. 
Com efeito, se um tal operador Q existisse, de PP = P concluiríamos 
QPP = QP, isto é, IP = I, donde P = I. 

Exemplo 5.4. Sejam P, Q: M 2 —> R 2 projeções ortogonais sobre duas 
retas do plano, uma das quais é perpendicular à outra. Todo vetor 
v € M 2 é a diagonal de um retângulo que tem Pv e Qv como lados. 
(Veja Fig. 5.1.) 


v 



Figura 5.1. 

Segue-se então que v = Pv+Qv para todo v G M 2 , ou seja, P+Q = I 
e Q = I — P. Portanto PQ = P(I — P) = P — P 2 = P — P = 0. Obtemos 
assim dois operadores não-nulos P, Q com PQ = 0. E possível mesmo 
que um operador não-nulo A G £(M 2 ) cumpra A 2 = 0. Basta pôr 

A(x,y) = (x-y,x-y). 

Um operador A chama-se nilpotente quando, para algum n G N, 
tem-se A n = 0. Um exemplo significativo de operador nilpotente é a 
derivação D: V n —> V n . Para todo polinómio p de grau < n tem-se 
D n+1 p = 0 , logo D n+1 = 0 . 

Exemplo 5.5. Se R a , Rp : M 2 —> M 2 são rotações em torno da origem 
com ângulos <x e |3 respectivamente, então R a • Rp = R a +p. (Isto pode 
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ser visto geometricamente na Fig. 5.2 ou usando as fórmulas de 
cos(a+ |3) e sen(a+ (3)). Se S: M 2 —» M 2 é a reflexão em torno de uma 
reta então S • S = I. Isto se segue da expressão S = 2P — I, levando 
em conta que P • P = P, mas também pode ser visto geometricamente 
(com mais facilidade). 



Figura 5.2 - Rotações do plano. 


Exercícios 

5.1. Verifique explicitamente que o produto BA de transformações 
lineares é ainda uma transformação linear. 

5.2. Considere os operadores lineares R, S,P: R 2 —f M 2 , onde R é a 
rotação de 30° em torno da origem, S é a reflexão em torno da reta 
y = 2x e P é a projeção ortogonal sobre a mesma reta. 

(i) Mostre que se tem PS = SP = P. 

(ii) Verifique a igualdade RSR = S. 

(iii) Mostre que R não comuta com S nem com P. 

(iv) Determine todos os vetores v tais que PRv = 0 e RPv / 0. 

5.3. Dado o operador linear A: E —> E, seja N o conjunto dos vetores 
veE tais que Av = 0. Mostre que N é um subespaço vetorial de E. 
Prove que A 2 = 0 se, e somente se, para todo veE tem-se Ave N. 


Seção 5 


Produto de Transformações Lineares 55 


5.4. Sejam R, R': R 2 —> M 2 respectivamente as rotações de ângulos 0 
e 0' em torno da origem. Partindo do fato de que o produto RR' é a 
rotação de ângulo 0 + 0', use o Exemplo 4.2 para obter as fórmulas 
clássicas cos(0 + 0') = cos 0 • cos 0' — sen 0 • sen 0' e sen(0 + 0') = 
sen 0 • cos 0' + sen 0' • cos 0. 

5.5. Seja A: E —> E um operador nilpotente. Prove que existe algum 
vetor v/0 em E tal que Av = 0. 

5.6. Dados os operadores A, B: R 2 —> R 2 dados por A(x,y) = (x+y,0) 
e B(x,y) = (—y,x), obtenha as expressões dos operadores A + B, 
AB, BA, A 2 e B 2 . Descreva geometricamente esses cinco operadores. 
(Exemplo: A é a projeção sobre o eixo x paralelamente a uma certa 
reta. (Qual?)) 

5.7. Seja A: R 3 —> R 3 dado por A(x,y,z) = (ay + bz,cz,0). Mostre 
que A 3 = 0. 

5.8. Sejam A,B,C,D: R 2 —> R 2 os operadores dados por A(x,y) = 
(x,0), B(x,y) = (—y,x), C(x,y) = (0,y) e D(x,y) = (y,-x). Deter¬ 
mine o operador ABCD. 

5.9. Considere as transformações lineares A: R 2 —> R 3 e B: R 3 —> R 2 , 
definidas por: A(x,y) = (x,y,x + y) e B(x,y,z) = (ax+ (a— l)y + (1 — 
a)z, — bx+ (1 — b)y +bz). Determine o operador BA: R 2 —> R 2 . 

5.10. Dado o operador A: R 2 R 2 , com A(x,y) = (3x — 2y,2x + 7y), 
ache um vetor não-nulo v = (x,y) tal que Av = 5v. 

5.11. Sejam A, B: E —> E operadores lineares. Suponha que existam 
vetores u,v € E tais que Au e Av sejam L.D.. Prove que BAu e BAv 
são L.D.. Se a dimensão de E for igual a 2, prove também que ABu 
e ABv são L.D.. (Sugestão: se u e v são L.D. o fato é óbvio. Caso 
contrário, u e v formam uma base de E. Exprima Bu e Bv em termos 
dessa base e depois aplique A.) 

5.12. Sejam A, B: R 3 —> R 3 definidos por A(x,y,z) = (x,y,0) e 
B(x,y,z) = (x + z,y,0). Obtenha vetores u,v € R 3 tais que Au e 
Av sejam L.D. porém ABu e ABv sejam L.I.. 

5.13. No espaço vetorial V dos polinómios, considere os operadores 
lineares D, A: V —> V de derivação (Dp(x) = p'(x)) e multiplicação 
por x (Ap(x) = xp(x)) respectivamente. Determine DA — AD. 
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5.14. Seja A: R 2 —> R 2 o operador linear definido por A(x,y) = (ax + 
by,cx + dy). Verifique que A 2 — (a + d)A = (bc — ad)I. Use esta 
igualdade para provar que, se ad —bc / 0, existe um operador linear 
B : R 2 —> R 2 tal que BA = AB = I. 

5.15. Seja C(A) o conjunto dos operadores lineares X: E —> E que 
comutam com o operador A € £(E) (isto é, AX = XA). Prove que C(A) 
é um subespaço vetorial de £(E) e que X, Y € C(A) => XY € C(A). 

5.16. Seja A: R 2 —> R 2 um operador linear que não é da forma <xl. 
Prove: 

(a) Existe w € R 2 tal que {w, Aw — w} c R 2 é uma base. 

(b) Se P: R 2 —> R 2 é o operador que a cada v = xw + y(Aw — w) € R 2 
faz corresponder Pv = xw então AP / PA. 

Conclua que os únicos operadores lineares em R 2 que comutam 
com todos os demais são os da forma cd. 

5.17. Estenda o exercício anterior para todos os espaços vetoriais de 
dimensão finita (maior do que 1) em vez de R 2 . 

5.18. Sejam A: E —> E uma transformação linear e B: F —> E uma 
função tal que AB = Ip e BA = U. Prove que B é uma transformação 
linear. 

5.19. Seja E um espaço vetorial de dimensão n. Para todo k = 
2,...,n, exiba um operador linear A: E —> E tal que A k = 0 mas 
Aí / 0 se j < k. 

5.20. Sejam A,P: E —> E operadores lineares não-nulos tais que 
AP = 0. Prove que existem vetores diferentes de zero u / v com 
Au = Av. 

5.21. Sejam A: R 2 —> R 2 um operador linear eP:R 2 ->R 2 a projeção 
ortogonal sobre uma reta r (passando pela origem). Prove que as 
seguintes afirmações são equivalentes: 

(a) Para todo v€r tem-se Av € r. 

(b) PAP = AP. 

5.22. Seja X: E —> G uma transformação linear tal que Xw ^ 0 para 
todo w 7 ^ 0 em E. Prove que se A, B e £(E;E) cumprem XA = XB 
então A = B. 
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5.23. Seja X: F —> F uma transformação linear com a seguinte pro¬ 
priedade: para cada w € F existe (pelo menos) um vetor veE tal que 
Xv = w. Suponha que A, B e £(F; G) cumprem a igualdade AX = BX. 
Prove que A = B. 

5.24. Sejam A, B: E —> F transformações lineares tais que, para todo 
operador linear X: F —> F, tem-se XA=XB. Prove que A=B. 
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Nesta seção, será examinada com cuidado a possibilidade de uma 
transformação linear admitir ou não uma inversa. Veremos que isto 
está associado à existência e à unicidade da solução de um sistema 
de equações lineares. Será introduzido o conceito de isomorfismo, que 
dará um sentido preciso à afirmação de que dois espaços vetoriais de 
mesma dimensão são algebricamente indistinguíveis. Tudo começa 
com o núcleo e a imagem de uma transformação. 

A toda transformação linear A: E —> E estão associados dois sub- 
espaços vetoriais indispensáveis para estudar o comportamento de 
A: o núcleo de A, que é um subespaço de E, e a imagem de A, que é 
um subespaço de F. 

A imagem de A é o subconjunto Im(A) c E, formado por todos 
os vetores w = Av e F que são imagens de elementos de E pela 
transformação A. 

A noção de imagem tem sentido seja qual for a função A: E —> E, 
seja linear ou não. Quando A é linear, então Im(A) é um subespaço 
vetorial de F, como se vê facilmente. 

Se Im(A) = E, diz-se que a transformação A é sobrejetiva. Isto 
significa que, para qualquer w e E dado, pode-se achar v £ E tal que 
A • v = w. 

Seja X c E um conjunto de geradores do espaço vetorial E. A 
imagem da transformação linear A: E —> E é o subespaço vetorial 
de E gerado pelos vetores Av, v € X. Em particular, A é sobreje¬ 
tiva se, e somente se, transforma X num conjunto de geradores de E. 
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Se vi,..., v n geram E os vetores Avi,..., Av n geram Im(A). Segue- 
se que a dimensão de Im(A) é menor do que ou igual à dimensão 
do domínio de A. Este fato será tornado mais preciso a seguir. 
(V. Teorema 6 . 6 .) 

Exemplo 6.1. Dado um sistema linear de m equações a u incógnitas 


QllX! + a 12 x 2 H-b a ln x n = b] 

a 2 ixi + a 22 x 2 H-b a 2n x n = b 2 


Cln 1 1 X1 ~b a m 2 X 2 + • • • “b U^^Xn — b m , 


seja A: R n —> R m a transformação linear cuja matriz nas bases ca¬ 
nônicas de R n e R m é a = [aq]. Isto significa, como sabemos, que, 
para j = 1 ,..., n, os vetores 


m 



i=1 


são os vetores-coluna da matriz a. Em termos da transformação 
linear A, o sistema acima pode ser interpretado como o problema 
de achar um vetor x = (xi,..., x n ) € R n tal que Ax = b, onde b = 
(b i,... ,b m ). Portanto o sistema admite solução se, e somente se, o 
vetor b pertence à imagem da transformação linear A, o que equivale 
a dizer que os conjuntos (vi,..., v n } e (vi,..., v n , b} geram ambos o 
mesmo subespaço Im(A). 

Exemplo 6.2. Um funcional linear f: E —> Ré sobrejetivo ou é 
igual a zero, pois {0} e R são os únicos subespaços vetoriais de R. 
A derivação D: C k (R) —> C k_ 1 (R) é sobrejetiva, e o mesmo se dá 
com o operador D: C°°(R) —> C°°(R) e com a transformação linear 
D: V n —> Pn-i • Se P: R 2 —> R 2 é a projeção ortogonal sobre uma reta 
r, a imagem de P é essa reta r. 

Uma transformação linear B: E —> E chama-se uma inversa à 
direita da transformação linear A: E —> E quando se tem AB = fi, ou 
seja, quando A(Bw) = w para todo weE. 

Teorema 6.1. A fim de que uma transformação linear A: E —> E, 
entre espaços vetoriais de dimensão finita, possua uma inversa à di¬ 
reita B € £(F;E) é necessário e suficiente que A seja sobrejetiva. 
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Demonstração: Se A admite uma inversa à direita B: F —» E então, 
para todo w £ F tem-se A(Bw) = w, logo w = A • v, onde v = Bw, 
e A é sobrejetiva. (Aqui não se usou a linearidade de A, e muito 
menos a finitude das dimensões de E e F.) Suponhamos, em se¬ 
guida, que A seja sobrejetiva. A fim de definir uma transforma¬ 
ção linear B: F —> E com A(Bw) = w para todo w € F, tomamos 
uma base B = {w 1 ,...,w m } c F. Como A é sobrejetiva, podemos 
escolher vetores vi,... ,v m € E tais que Avi = w -\,..., Av m = w m . 
Pelo Teorema 4.1, existe uma transformação linear B: F —> E tal que 
Buy = vi,..., Bw m = v m . Afirmamos que, para todo w € F, tem- 
se A(Bw) = w. Com efeito, sendo B uma base, podemos escrever 
w = |3i"Wi + • • • + |3 m w m , portanto 

A(Bw) = A(|3iBwi H-h (3 m Bw m ) 

= A((3ivi + • • • + (3 m v m ) 

= Pi Avi + • • • + (3 m Av m 
= Pivvi -t-F |3 m w m = w. □ 

Exemplo 6.3. Uma transformação linear sobrejetiva A: E —> F 
pode admitir mais de uma inversa à direita B: F —> E. Um exem¬ 
plo simples é dado pela transformação linear A: R 3 -> R 2 , defi¬ 
nida por A(x,y,z) = (x,y). Fixados arbitrariamente a,b € R, a 
transformação linear B: R 2 —> R 3 , definida por B(x,y) = (x, y, ax + 
by), é uma inversa à direita para A. Variando os números a e b, 
obtemos infinitas possibilidades para B. 

Exemplo 6.4. Uma inversa à direita para a derivação D: V n+ 1 —> 
V n é a transformação linear J: P n —> Pn+i, que a cada polinómio 
p(x) = a Q + aix-|- 1 - a n x n de grau < n faz corresponder o polinómio 

Jp(x) = a 0 x + ^x 2 + • • • + ^-j-x^ 1 . 

O núcleo da transformação linear A: E —> F é o conjunto dos ve¬ 
tores v € E tais que Av = 0. Usaremos a notação Aí [A] para repre¬ 
sentar o núcleo de A. É fácil ver que Aí {A) é um subespaço vetorial 
de E. 

Uma transformação linear A: E —> F chama-se injetiva quando 
v / v ' em E => Av / Av' em F. Equivalentemente: Av = Av' = 4 > v — V. 
Esta noção tem sentido para qualquer função A: E —> F, seja ela 
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linear ou não. No caso linear, porém, o teorema abaixo simplifica a 
verificação da injetividade. 


Teorema 6.2. A fim de que uma transformação linear A: E —> F 
seja injetiva é necessário e suficiente que seu núcleo J\f[A) contenha 
apenas o vetor nulo. 


Demonstração: Seja A injetiva. Então v e U{A) => A • v = 0 = 
A • 0 => v = 0, logo Af[A) = {0}. Reciprocamente, seja J\f{A) = {0}. 
Então Av = Av' => A(v — v') = Av — Av' = 0 v — v' € A/ - (A) 
v — v' = 0 => v = v', logo A é injetiva. □ 


Teorema 6.3. Uma transformação linear é injetiva se, e somente se, 
leva vetores L.I. em vetores L.I.. 


Demonstração: Seja A: E —> E uma transformação linear injetiva. 
Se os vetores vi,..., v n € E são linearmente independentes, vamos 
provar que suas imagens Avi,..., Av n são vetores linearmente inde¬ 
pendentes em F. Com efeito, se oq • Avi + • • • + a n ■ Av n = 0 então 
A(oqvi + • • • + a n v n ) = 0, logo oqvi + • • • + <x n v n = 0 pois A é in¬ 
jetiva. Como vi,...,v n são L.I., segue-se que oq = • • • = <x n = 0, 
portanto Avi,..., Av n são L.I.. Reciprocamente se a transformação 
linear A: E —> F leva vetores L.I. em vetores L.I. então v / 0 em 
E => {v} L.I. =^> {Av} L.I. => Av 7 ^ 0, portanto A/"(A) = {0} e A é inje¬ 
tiva. I 

Segue-se deste teorema que se E tem dimensão finita n e A: E —> 
E é uma transformação linear injetiva então dim E > n. Assim, por 
exemplo, não existe uma transformação linear injetiva de M 3 em E 2 . 


Teorema 6.4. Seja A: E —» E uma transformação linear. Para todo 
b G Im(A), o conjunto V = (x € E;Ax = b}, formado pelas soluções 
do sistema linear Ax = b, é uma variedade afim em E, paralela ao 
núcleo N[A). 


Demonstração: Fixemos xo G V, isto é, com Axo = b. Afirmamos 
que V = xo + M[A). Com efeito, v € M[A) ^ A(xq + v) = Axq + Av = 
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b + 0 = b=>xo+veV. Logo xo + jV(A) C V. Reciprocamente, 

x G V =>• x = xo + (x — xo) = xo + v 

=> b = Ax = A(xo + v) = Axo + Av = b + Av 
=> b = b + Av 
=> Av = 0 

=> x = x 0 + v e x 0 + Aí{ A). 

Logo V C xo + Áí{ A). □ 

Observação. Geometricamente, o Teorema 6.4 significa que o espa¬ 
ço vetorial E se exprime como uma reunião de lâminas paralelas 
V = xo + jV(A), cada uma das quais é uma variedade afim que 
se transforma por A num único ponto beZm(A). Este ponto, na¬ 
turalmente, varia quando se passa de uma lâmina para outra. (Veja 
Fig. 6.1.) 




Figura 6.1. 


Algebricamente, o Teorema 6.4 significa que, para cada b € 
Im(A), obtêm-se todas as soluções x e E do sistema linear Ax = b 
assim: acha-se uma “solução particular” xo desse sistema e a solução 
geral x = x 0 + v é a soma dessa solução particular com a “solução ge¬ 
ral v do sistema homogêneo associado” Ax = 0. Naturalmente, esta 
última é um elemento qualquer do núcleo de A. Se b ^ Im(A) então 
o sistema Ax = b, evidentemente, não possui solução. 

Exemplo 6.5. O núcleo de uma rotação ou de uma reflexão no plano 
M 2 reduz-se a {0}. O núcleo da projeção ortogonal P: M 2 —* M 2 sobre 
a reta r é a reta que contém 0 e é perpendicular a r. O núcleo da 
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derivação D: C k (M) —> é o subespaço uni-dimensional de 

C k (M) formado pelas funções constantes. O núcleo de um funcional 
linear não-nulo cp: E —> R é um hiperplano HcE. 

Sejam A:E—> F e B: E —> E transformações lineares. Diz-se que 
B é uma inversa à esquerda de A quando BA = I k , isto é, quando 
B(Av) = v para todo v e E. 

Exemplo 6.6. Seja A: M 2 —> M 3 definida por A(x,y) = (x + 2y,2x + 
3y, 3x + 4y). A transformação linear B: M 3 —> M 2 , dada por 

B(x,y,z) = (—3x + 2y,2x —y) 


cumpre a relação 

B(A(x,y)) = B(x + 2y,2x + 3y,3x + 4y) 

= (—3(x + 2y) + 2(2x + 3y),2(x + 2y) - (2x + 3y)] 

= (*,y) 

para qualquer (x,y) € M 2 . Logo B é uma inversa à esquerda para A. 

Exemplo 6.7. Uma transformação linear pode admitir uma infini¬ 
dade de inversas à esquerda. Por exemplo, seja A: R 2 —> M 3 dada 
por A(x,y) = (x,y,0). Para quaisquer a,b e R, a transformação 
linear B: M 3 —> M 2 , dada por B(x,y,z) = (x + az,y + bz) é uma in¬ 
versa à esquerda de A, pois BA(x,y) = B(x,y,0) = (x,y) para todo 
(x,y) € M 2 . 

Teorema 6.5. Sejam E e E espaços vetoriais de dimensão finita. A 
transformação linear A: E —> F possui inversa à esquerda se, e so¬ 
mente se, é injetiva. 

Demonstração: Seja B: F —> E inversa à esquerda de A. Então 
Au = Av => u = B(Au) = B(Av) = v, logo A é injetiva. Reciproca¬ 
mente, suponhamos que A seja injetiva. A fim de obter uma inversa 
à esquerda B para A, tomemos {yi ,..., v n } c E, uma base. Pelo Te¬ 
orema 6.3, os vetores Avi,..., Av n € E são L.I., logo podemos achar 
vetores wi,..., € E tais que 

{AV!, . . . , Av n , W!,..., w k } C E 

seja uma base. (Teorema 3.4.) Pelo Teorema 4.1, a fim de definir 
a transformação linear B: E —> E, basta especificar seus valores nos 
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elementos desta base. Poremos B(Avi) = vi,..., B(Av n ) = v n , Bwi = 
0,..., Bwic = 0. Dado qualquer v € E, tem-se v = aivi + • • • + a n v n , 
logo 

BAv = B(ai Avi + • • • + cx n Av n ) 

= aiBAvi + • • • + oc n BAv n 
= ociVi 4-1- cx n v n = v, 

portanto B é uma inversa à esquerda de A. □ 

Uma transformação linear A: E —> E chama-se invertível quando 
existe B: E —> E linear tal que BA = E e AB = fi, ou seja, quando B 
é, ao mesmo tempo, inversa à esquerda e à direita de A. 

Neste caso, diz-se que B é a inversa de A e escreve-se B = A -1 . 

A fim de que a transformação linear A seja invertível, é neces¬ 
sário e suficiente que ela seja injetiva e sobrejetiva. Diz-se, então, 
que A é uma bijeção linear entre E e E ou, mais apropriadamente, 
que A: E —> F é um isomorfismo e que os espaços vetoriais E e F são 
isomorfos. 

SeA:E—i F e B: F -» G são isomorfismos, então A -1 : F —> E e 
BA: E —» G também são isomorfismos. Tem-se (BA) -1 = A -1 B -1 e, 
para ot / 0, (cxA) -1 = ^ • A -1 . 

Um isomorfismo A: E —> E entre espaços vetoriais transforma 
toda base de E numa base de E. Reciprocamente, se uma transfor¬ 
mação linear A: E —> E leva alguma base de E numa base de F então 
A é um isomorfismo. 

Do que foi dito acima resulta, em particular, que dois espaços 
vetoriais de dimensão finita isomorfos têm a mesma dimensão. A 
recíproca é verdadeira, como veremos agora. 

Com efeito, seja E um espaço vetorial de dimensão finita n. Fi¬ 
xando uma base {vi,...,v n } C E, podemos definir uma transfor¬ 
mação linear A: R n —> E pondo, para cada v = (cti,...,a n ) € R n , 
Av = cxivi + • • • + <x n v n . Tem-se Aei = vi,..., Ae n = v n . Assim, A 
transforma a base canônica {ei,..., e n ) c R n na base {vi,..., v n } c E, 
logo é um isomorfismo entre R n eE, 

Noutras palavras, todo espaço vetorial de dimensão n é isomorfo 
a R n . 

Como o inverso A -1 : E —» R n e o produto BA -1 : E —> E de A por 
outro isomorfismo B: R n —> E são isomorfismos, segue-se que dois 
espaços vetoriais E, F, ambos de dimensão n, são isomorfos. 
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Exemplo 6.8. O espaço V n , dos polinómios de grau < u, tem di¬ 
mensão n+1, logo é isomorfo a M n+1 . Por sua vez, o espaço M(mxp), 
das matrizes m x p, é isomorfo a M mp , portanto V n é isomorfo a 
M(m x p) se, e somente se, n + 1 = mp. 

A noção de isomorfismo entre espaços vetoriais é fundamental. 

Ela nos permite identificar, sob o ponto de vista da Álgebra Li¬ 
near, espaços vetoriais que se apresentam sob formas à primeira 
vista diferentes. Por exemplo, a correspondência (a 0 ,..., a n ) <-> a 0 + 
cqx + • • • + a n x n , é um isomorfismo natural entre M n+1 e V n , que 
desempenha papel relevante em Análise. 

Noutro exemplo, se dispusermos os elementos de uma matriz n x 
n em fileiras paralelas à sua diagonal principal, veremos que há um 
total de 


n+(n-l) + --- + 2 + l 


n(n +1) 
2 


elementos nesta diagonal ou acima dela. Colocando esses elementos 
numa linha, em ordem determinada, obtemos um vetor de M n:u ^i/ 2 . 
Se a matriz dada é simétrica, os elementos abaixo da diagonal não 
são necessários para determiná-la pois apenas repetem os demais. 
Este processo estabelece um isomorfismo entre o espaço vetorial 
S das matrizes simétricas n x u e o espaço euclidiano K n í n + 1 )/ 2 , 
o que nos permite concluir que dim S = u(n + 1 )/2. Um isomor¬ 
fismo análogo (desprezando a diagonal principal que, neste caso, só 
contém zeros) mostra que as matrizes anti-simétricas n x n formam 
um espaço vetorial de dimensão u(n — 1 )/2. 


Teorema 6.6. (Teorema do Núcleo e da Imagem.) Sejam E, F 
espaços vetoriais de dimensão finita. Para toda transformação linear 
A: E —> F tem-se dim E = dim M[A) + dim Im(A). 


Demonstração: O teorema resulta imediatamente da seguinte 
afirmação mais precisa, que provaremos a seguir: se {Aui,..., Au p } 
é uma base de Im(A) e {vi,...,v q } é uma base de Aí [A] então 
(ui,... ,u p , vi,...,Vq} é uma base de E. 

Com efeito, em primeiro lugar, se tivermos 


OqUi + • • • + CXpUp + PiV, + • • • + |3qVq — 0 (*) 

então, aplicando o operador A a ambos os membros desta igualdade 
e lembrando que vi,..., v q pertencem ao núcleo de A, obtemos 

oq Aui + • • • + (Xp Aup = 0. 
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Como os vetores Aui,..., Au p são L.I., resulta daí que oq = ■ • • = 
«p = 0. Portanto a igualdade (*) se reduz a 

PlV] + • • • + (3qVq = 0. 

Como vi,...,v q são L.I., concluímos que (3i = • • • = (3 q = 0. Isto 
mostra que os vetores u l5 ... ,u p , vi, ...,v q são L.I.. 

Em seguida, consideremos um vetor arbitrário w G E. Como 
Aw G Im(A), podemos escrever 


Aw = oci Aui + • • • + oíp Aup , 

pois {Aui,..., Aup} é uma base da imagem de A. A igualdade acima 
pode ser reescrita como 

A[w — (oqui H-1- a p u p )] = 0. 

Assim, o vetor w — (oqui H-b a p u p ) pertence ao núcleo de A, logo 

pode ser expresso como combinação linear dos elementos da base 
{vi,..., v q }. Temos então 


w — (oqui H-b a p u p ) = piV] H-b (3 q v q , 

ou seja, w = aqui + • • • + a p u p + (3ivi + • • • + |3 q v q . Isto mostra que 
os vetores ui,..., u p , vi,..., v q geram E e portanto constituem uma 
base. □ 

Corolário. Sejam E, F espaços vetoriais de mesma dimensão finita 
n. Uma transformação linear A: E —> F é injetiva se, e somente se, é 
sobrejetiva e portanto é um isomorfismo. 

Com efeito, temos n = dim AA(A) + dim Im(A). Logo Áf[A) = {0} 
se, e somente se dim Im(A) = n, ou seja, Im(A) = E. □ 

Exemplo 6.9. Um caso particular do corolário acima diz que, num 
espaço vetorial de dimensão finita, um operador linear é injetivo se, 
e somente se, é sobrejetivo. Isto seria falso num espaço de dimensão 
infinita, como se vê no seguinte exemplo: sejam A, B: R°° —> M°° 
definidos por 

A(xi, x 2 , x 3 ,...) = (0, xi, x 2 , x 3 ,...) 
e 

B(x 1 ,x 2 ,x 3 ,...) = (X 2 ,X 3 ,X4,...). 
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A e B são operadores lineares. O primeiro é injetivo mas não é so- 
brejetivo e o segundo é sobrejetivo mas não é injetivo. 

Exemplo 6.10. O Teorema do Núcleo e da Imagem dá outra expli¬ 
cação para o fato de um hiperplano Hcl n ter dimensão n — 1 . Por 
esse teorema, se dim E = uef:E—) I é um funcional linear / 0 
então o núcleo de f é um subespaço vetorial de dimensão n — 1 em E, 
pois f não-nulo implica Im(f) = R logo dim Im(f) = 1 e dim A/"(f) = 
dim E — dim Im(f) = n — 1. Ora, o hiperplano 

El = {(X!,..., x n ) € M n ; a! XI -I-E a n x n = 0} 

é o núcleo do funcional linear não nulo f: R n —> R, definido por 

f(x-|,...,x n ) = cltX! H-+ a n x n . 

Teorema 6.7. Se uma transformação linear A: E —> F tem uma 
inversa à esquerda B: E —> E e uma inversa à direita C: F —> E então 
B = C e A é um isomorfismo, com A _1 = B = C. 

Demonstração: Tem-se BA — I E e AC = Ip. Portanto B = BIp = 
B(AC) = (BA)C = I E C = C. □ 

Corolário. Seja dim E = dim E. Se as transformações lineares 
A:E—>E, B:E— >E são tais que BA = Ip então AB = Ip e B = A -1 . 

Com efeito, BA = Ip =4- A injetiva => A sobrejetiva (Corolário 
do Teorema 6.6) =)> AC = Ip para alguma C => C = B (Teor. 6.7) 

=> AB = Ip. □ 


Exercícios 

6.1. Prove que o núcleo e a imagem de uma transformação linear 
A: E —> E são respectivamente subespaços vetoriais de E e E. 

6.2. Seja A: E —> E um operador linear. Para quaisquer vetores 
u € A7(A) e v € Zm(A), prove que se tem Au € A7(A) e Av € Im(A). 

6.3. Encontre números a, b, c, d de modo que o operador A: R 2 —> R 2 , 
dado por A(x,y) = (ax+by, cx+dy) tenha como núcleo a retay = 3x. 
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6.4. Ache a, b, c, d tais que o operador A: M 2 —> R 2 com A(x,y) = 
(ax + by, cx + dy), tenha a reta y = 2x como imagem. 

6.5. Escreva a expressão de um operador A: R 2 —> R 2 cujo núcleo 
seja a reta y = x e cuja imagem seja a reta y = 2x. 

6.6. Defina um operador A: R 2 —» R 2 que tenha como núcleo e como 
imagem o eixo x. 

6.7. Resolva um exercício análogo ao anterior, com a reta y = 5x em 
lugar do eixo x. 

6.8. Considere a transformação linear A: M 4 —> R 3 , dada por 

A(x,y,z,t) = (x + y +z + 2t,x — y + 2z,4x + 2y +5z + 6t), 

encontre um vetor b € R 3 que não pertença à imagem de A e com 
isso exiba um sistema linear de três equações com quatro incógnitas 
sem solução. 

6.9. Seja E = C°(R) o espaço das funções contínuas f: R —> R. Defina 
o operador linear A: E —> E pondo, para cada f € E, Af = cp, onde 
<p(x) = Jq f(t) dt, x <E R. Determine o núcleo e a imagem do opera¬ 
dor A. 

6.10. Seja E = R°° o espaço vetorial cujos elementos são as se- 
qüências x = (xi,X 2 ,...) de números reais. Defina os operadores 
lineares A, B: E —> E pondo Ax = (xi, 0,X2,0,X3,...) e Bx = y, onde 
y = (y i, y 2 ,...), onde yk = Xk+i — 2xk . Determine o núcleo e a imagem 
de A e B. 

6.11. Assinale verdadeiro (V) ou falso (F): 

( ) Uma transformação linear A: E—»E é sobrejetiva se, e somente 
se, dim A/ - (A) = dim E — dim F. 

( ) Dada a transformação linear A: E —> E, para todo b fixado em 
F, o conjunto G = (x € E; Ax = b) é um subespaço vetorial de E. 

( ) Para todo operador linear A: E —> E, tem-se E = AA(A) © Tm A. 

( ) Todo operador linear injetivo no espaço C°(R) das funções con¬ 
tínuas f: M —> R é também sobrejetivo. 
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( ) O núcleo de toda transformação linear A: M 5 —» M 3 tem di¬ 
mensão > 3. 


6.12. Seja a = [atj] uma matriz m x n. Se suas colunas geram um 
subespaço vetorial F, de dimensão r, em ]R m prove que, para todo 

n 

b € F, as soluções x = (xi,..., x n ) do sistema linear Y_ a ij*j = b* (i = 

j=i 

1 ,..., m) formam uma variedade afim de dimensão n — r em ]R n . 

6.13. Prove que cada uma das transformações lineares abaixo é inje¬ 
tiva e obtenha uma inversa à esquerda linear para cada uma delas. 

(a) A: R —» R n ; A(x) = (x,2x,... ,nx). 

(b) B: K 2 —> M 3 ; B(x,y) = (x + 2y,x + y,x — y). 

(c) D: M 3 —> M 4 ; D(x,y,z) = (2x,3y,5z,x + y +z). 

(d) C: Vn —> V n +2 ; C • p (x) = (x 2 + 1 )p (x). 


6.14. Seja F um espaço vetorial de dimensão finita. Dado um opera¬ 
dor linear A: E —> E, defina o novo operador Ta: £(E) —> £(E) pondo 
Ta(X) = AX, para todo X € £(E). Prove que Ta é invertível se, e 
somente se, A é invertível. Mesmo problema para Sa(X) = XA. 

6.15. Sejam Fi , F z subespaços de E tais que dim Fi +dim F 2 = dim E. 
Mostre que existe um operador linear A: E —> E tal que Fi = AT [A) e 

F 2 =Im(A). 

6.16. Prove que uma transformação linear A: E -) F é sobrejetiva 
se, e somente se, transforma um conjunto de geradores de E num 
conjunto de geradores de F. 

6.17. Seja A: M 2 —» M 2 um operador linear 7 ^ 0. Se A n = 0 para 
algum n > 2, prove que A 2 = 0. [Sugestão: seja F = ImA. Então a 
restrição de A à reta F é zero ou é invertível.] 

6.18. Seja A: V n —> V n 0 operador linear definido por A • p(x) = 
x • p'"(x). Descreva 0 núcleo e a imagem de A. Obtenha bases para 
Aí[A] e para Zm(A). 
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6.19. Assinale verdadeiro (V) ou falso (F): 

( ) Se a transformação linear A: M m —> M n é injetiva então 
dimXm(A) = m. 

( ) Se A: M m —> M n é sobrejetiva então dimA/"(A) = m — n. 

( ) Se A, B € £(M n ) são tais que dimXm(A) = dimXm(B) então 
dim Xm(AB) = dimXm(BA) = dimXm(A). 

( ) Se Aí {A) é gerado pelos vetores vi, V 2 , V 3 então a imagem do 
operador A: M 5 —> M 5 tem dimensão 2. 

6.20. Determine uma base para a imagem de cada uma das trans¬ 
formações lineares abaixo e indique quais são sobrejetivas. 

(a) A: M 2 —» M 2 , A(x,y) = (x —y,x — y). 

(b) B: M 4 —> M 4 , B(x,y,z, t) = (x + y,z + t,x + z,y +t). 

(c) C: M 3 —> M 3 , C(x,y,z) = (x+^,y + |,z+|)- 

(d) D: M(2 x 2) —> M(2 x 2), D • X = AX, onde A = J . 

(e) E: V n —> X* n+1 , E • p(x) = x • p(x). 

6.21. Prove que as transformações lineares a seguir são sobrejetivas 
e obtenha uma inversa à direita linear para cada uma delas. 

(a) A: M 3 —> M 2 , A(x,y,z) = (2x + y,z). 

(b) B: V n —> M, B • p (x) = p (1). 

(c) C: M 2 —> M 2 , C(x,y) = (x + y,x — y). 

(d) P: M n R n ^, P(x 1 ,...,x n ) = (xi,...,x n _i). 

Mostre que em três dos quatro exemplos acima, as transforma¬ 
ções dadas admitem infinitas inversas à direita lineares e infinitas 
não-lineares. 
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6.22. Para cada uma das nove transformações lineares dos exercí¬ 
cios anteriores, determine o núcleo e obtenha uma base do mesmo, 
caso não se reduza a {0}. 

6.23. Seja T: V n —> V n o operador linear definido por T.p(x) = 
5p(x) — 4p'(x) + p"(x). Mostre que seu núcleo é {0} e conclua que, 
para todo polinómio b(x) existe um polinómio p(x) tal que 5p(x) — 
4p , (x)+p ,, (x) = b(x). 

6.24. Seja X c F um subconjunto com a seguinte propriedade: toda 
transformação linear A: F —> F cuja imagem contém X é sobrejetiva. 
Prove que X é um conjunto de geradores de F. 

(Sugestão: é muito mais fácil do que parece.) 

6.25. Seja A: E —> F uma transformação linear sobrejetiva entre 
espaços vetoriais de dimensão finita. Prove que existe um subespaço 
vetorial E' c E tal que a restrição de A a E' é um isomorfismo 
sobre F. 

6.26. Seja A: E — > F um isomorfismo. Se T: F — > E é tal que AT = I F 
(ou TA = Ie), prove que T é linear. 

6.27. Sejam E, F espaços vetoriais de dimensão finita. Se dim E < 
dim F, prove que existem transformações lineares A: E —> Fe 
B: F —> E tais que A é injetiva e B é sobrejetiva. 

6.28. Dadas as transformações lineares A:E—> F, B:F—» G, assi¬ 
nale V(erdadeiro) ou F(also) nas seguintes implicações: 

( ) BA sobrejetiva =)> B sobrejetiva. 

( ) BA sobrejetiva => A sobrejetiva. 

( ) BA injetiva => B injetiva. 

( ) BA injetiva => A injetiva. 

Prove ainda que se E = F = G então as quatro implicações são 
verdadeiras. 

6.29. Prove que toda transformação linear A pode escrever-se como o 
produto A = TS, onde S é uma transformação linear sobrejetiva e T é 
uma transformação linear injetiva. Vale também uma decomposição 
do tipo A = S'T', com S' sobrejetiva e T' injetiva? 

6.30. Dado o conjunto finito X com n elementos, prove que o espaço 
vetorial .F(X;M) é isomorfo a M n . Mais geralmente, dado qualquer 
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espaço vetorial E, estabeleça um isomorfismo entre .F(X;E) e E n = 
E x • • • x E (n fatores). 

6.31. Dados os números reais a = a 0 < ai < • ■ ■ < a n = b, considere 
o conjunto Ei c .F([a, b];R) formado pelas funções f: [a, b] —> R que, 
em cada intervalo fechado [ut_i, aj, i = 1,... ,u, são representadas 
por polinómios de grau < 1, isto é, f (x) = cqx + (3t para ai_i < x < 
cu. Prove que Ei é um subespaço vetorial e que a correspondência 
f i—» (f(a 0 ),..., f(a n )) é um isomorfismo entre Ei e R n+1 . Conclua 
que dim Ei = n + 1. Descreva a base de Ei que corresponde à base 
canônica de R n+1 . 

6.32. Com a notação de exercício anterior, seja E 2 0 conjunto das 
funções deriváveis f: [a, b] —» R cujas restrições aos intervalos 
[ai_i,aj, i = l,...,n, são polinómios de grau < 2. Considerando 
a derivação D: E 2 —> E], prove que E 2 C .F([a,b];R) é um subespaço 
vetorial de dimensão n + 2 . 

6.33. Sejam E um espaço vetorial de dimensão finita, E* = £(E;R) 
seu dual e E** = £(E*;R) seu bi-dual. Considere a correspondência 

E —> E**, que associa a cada vetor v e E 0 elemento £,(v) = v** € E** 
tal que v**(f) = f(v) para todo v e E. Prove que í, é um isomorfismo. 
[Este exercício significa que f (v) pode ser considerado como um valor 
da função f de variável v ou da função v (mais exatamente, v**) de 
variável f.] 

6.34. Seja f: E —> R um funcional linear não-nulo no espaço vetorial 
E, de dimensão n. Prove que existe uma base {ui,...,u n } C E tal 
que f (ui ) = •■■= f (un_i) = 0 e f (u n ) = 1. Use este fato para provar 
que se g: E —> R é outro funcional linear não-nulo então existe um 
isomorfismo A: E —> E tal que g = f o A. 

6.35. Dado 0 funcional linear não-nulo f: E —> R, prove que existe 
um vetor u e E tal que f (u) = 1. Seja FcEo subespaço (reta) gerado 
por u. Prove que E = F © jV(f). 

6.36. Sejam f, g: E —> R funcionais lineares não-nulos no espaço 
vetorial E, de dimensão finita. Prove que um deles é múltiplo do 
outro se, e somente se, eles têm 0 mesmo núcleo. 

6.37. Supondo Y c X, descreva 0 núcleo e a imagem da transfor¬ 
mação linear R: J^XjR)—>.F(Y;R), que associa a cada função f: X—>R 
sua restrição Rf = f|Y: Y —> R. 
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6.38. Sejam E, F os espaços vetoriais cujos elementos são respecti¬ 
vamente as funções pares e as funções ímpares R —> R. Descreva o 
núcleo e a imagem das transformações lineares R: E —».F([0, +oo);R) 
e R': F -) .F([0,+oo);R) que associam a cada função f: R —> R sua 
restrição ao intervalo [ 0 ,+oo). 

6.39. Estabeleça um isomorfismo entre o espaço vetorial das matri¬ 
zes simétricas n x n e o espaço das matrizes triangulares inferiores 
(dij = 0 se i < j). Idem entre as matrizes anti-simétricas e as trian¬ 
gulares inferiores com diagonal nula. 

6.40. Sejam Ei e E 2 subespaços vetoriais de dimensão 3 em R 5 . Quais 
são as dimensões possíveis do subespaço Ei n E 2 ? Mesma pergunta 
com dim E] = 4 e dim F 2 = 3. 

6.41. Seja A: E —) E um operador linear. Prove que A 2 = 0 se, e 
somente se, Im(A) c Aí (A). 

6.42. Dadas as transformações lineares A, B: E —> E, entre espaços 
vetoriais de dimensão finita, prove: 

(a) Se Aí(A) = AÍ{B) então existe um isomorfismo Q: E —» E tal que 
B = QA. 

(b) Se Zm(A) = Zm(B) então existe um isomorfismo P: E —» E tal que 
B = AP. 

(c) Se dim Aí [A] = dim A7(B) (ou, equivalentemente, dim Im(A) = 
dim Im(B)) então existem isomorfismos P:E—> E e Q: E —> E tais 
que B = QAP. 

(d) Existem operadores lineares A,B: E —> E tais que AÍ[A)=AÍ{B), 
Im(A) = Im(B), sem que exista um isomorfismo P: E —> E, com 
B = P^AP. 

6.43. Se os vetores vi,..., v m € E geram um subespaço vetorial de 

dimensão r, prove que 0 conjunto dos vetores (ai,...,a m ) € R m 
tais que oqvi + • • • + cx m v m = 0 é um subespaço vetorial de R m 
com dimensão m — r. [Sugestão: considere a transformação linear 
(ai,..., <x m ) oqvi -I-1- a m v m , de R m em E.] 

6.44. Seja A: E —> E um operador linear tal que A k = 0 para algum 
número natural k. Prove que, para todo a/0, 0 operador A — od é 
invertível. 
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6.45. Se, para algum a 0 / 0, tem-se a 0 I + <xi A + • • • + am.A m = 0, 
prove que o operador linear A é invertível. 

6.46. Sem fazer hipóteses sobre as dimensões de E e E, sejam A: E —» 
FeB:E-)E transformações lineares. Se AB é invertível, prove que 
A é sobrejetiva e B é injetiva. Se AB e BA são invertíveis, prove que 
A é invertível. 

6.47. Calcule (B^ 1 AB) m . 
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Esta seção trata da decomposição de um espaço vetorial como soma 
de subespaços independentes, mostra que essa decomposição equivale 
a definir um operador idempotente no espaço e estabelece a conexão 
entre projeções e involuções, ou simetrias. 

Na Seção 2, vimos que se Tq e F 2 são subespaços do espaço vetorial 
E, o subespaço vetorial de E gerado pela reunião Fi U F 2 é o conjunto 
Ei + E 2 de todas as somas u + v, onde u e Ei e v € E 2 . No caso 
particular em que Fi n F 2 = {0}, escreve-se Fi © F 2 em vez de Fi + F 2 , 
diz-se que Fi © F 2 é a soma direta de Fi com F 2 e prova-se (Teorema 
2.1) que a condição Fi n F 2 = {0} equivale a dizer que u + v = u' + v', 
com u, u' € Fi e v, v' € F 2 , implica u = u'ev = V. 

Existe uma noção análoga à de soma direta, que é o produto car¬ 
tesiano E] x E 2 de dois espaços vetoriais Ei e E 2 . Aqui Ei e E 2 não 
precisam ser subespaços vetoriais do mesmo espaço E. Os elemen¬ 
tos do conjunto Ei x E 2 são os pares ordenados (u,v), onde u € Ei 
e v e E 2 . As operações que tornam E] x E 2 um espaço vetorial são 
definidas por 

(u, v) + (u 7 , v') = (u + u', v + v'), <x(u,v) = (au, ccv), 

para quaisquer u,u' e Ei, v,v' e E 2 e <x G M. O vetor nulo de 
E] x E 2 é o par (0,0) e o inverso aditivo de (u,v) é (—u, —v). Se 
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{ui,...,u m } c Ei e {vi,...,v n } c E 2 são bases, é imediato consta¬ 
tar que {(ui,0), ..., (u m ,0), (0,vi), ..., (0,v n )} c Ei x E 2 é uma base, 
de modo que dim(Ei x E 2 ) = dim Ei + dim E 2 . 

Se Fi e E 2 são subespaços vetoriais de E, com Fi n E 2 = {0}, então 
a transformação linear 


A: Ei x f 2 —» Ei ® F 2 , 

definida por A(u,v) = u + v, u € Ei, v € f 2 , é um isomorfismo, 
como se verifica facilmente. Se {ui,..., u m } c Ei e {vi,..., v n } C E 2 
são bases então a base {(ui, 0),..., (u m , 0), (0, vi),... (0, v n )} de Ei x E 2 
é transformada por A no conjunto {ui,..., u m , vi,..., v n ) 0 qual é, 
por conseguinte, uma base de Fi © F 2 . Segue-se que dim(Ei ® F 2 ) = 
dim Fi + dim F 2 = m + n. 

No caso mais geral, em que a interseção Fi n E 2 dos dois subes¬ 
paços Fi, E 2 c E não se reduz necessariamente ao vetor nulo, a soma 
Fi + F 2 pode não ser uma soma direta mas, mesmo assim, está bem 
definida a transformação linear 

A: F] x F 2 —■> Fi + F 2 , 

onde A(u, v) = u + v para ueF] e v € F 2 . Obviamente, A é sobreje- 
tiva. Seu núcleo é formado pelos pares (u, v) tais que u + v = 0, isto 
é, v = —u, logo u e v pertencem ambos a Fi e a F 2 . Noutras palavras, 
Aí [A) = {(u, —u);u € Ei n f 2 }. A correspondência u 1 -» (u, —u) é um 
isomorfismo evidente entre Ei n F 2 e A7(A). Pelo Teorema do Núcleo 
e da Imagem, temos 

dim Ei + dim F 2 = dim(Fi x F 2 ) 

= dim J\í[A) + dim(Ei + F 2 ) 

= dim(Fi n F 2 ) + dim(Fi + F 2 ). 


Isto nos permite enunciar 0 

Teorema 7.1. Sejam Fi e F 2 subespaços de dimensão finita de um 
espaço vetorial E. Tem-se dim Fi + dim F 2 = dim(Fi n F 2 ) + 
dim(Fi + F 2 ). 

A noção de soma direta está intimamente ligada à noção de pro¬ 
jeção. Se E = Fi ©F 2 é a decomposição do espaço vetorial E como soma 
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direta dos subespaços Fi e F 2 , define-se 0 operador linear P: E —> E, 
projeção de E sobre Fp paralelamente a F 2 , do seguinte modo: todo 
vetor weEse escreve, de modo único, como soma w = u + v de 
um vetor u £ Fi com um vetor v £ F 2 . Põe-se então Pw = u. (Veja 
Fig. 7.1.) 



Figura 7.1. 

O operador linear P: E —> E assim definido tem imagem Fi e 
núcleo F 2 . Além disso, como se vê facilmente, P é idempotente, isto 
é, P 2 = P. O teorema seguinte mostra que, reciprocamente, todo 
operador linear idempotente é uma projeção. 

Preliminarmente, observemos que se P 2 = P então, para todo 
w £ Im(P), tem-se Pw = w pois w £ Im(P) => w = Pv => Pw = 
PPv = Pv = w. 

Teorema 7.2. Seja P: E — > E um operador linear. Se P 2 = P então 
E é a soma direta do núcleo com a imagem de P. Além disso, P é a 
projeção sobre Im(P) paralelamente a A7(P). 

Demonstração: Todo v £ E escreve-se como soma v = (v — Pv) + Pv, 
onde Pv, evidentemente, pertence a Im(P) e, como P(v — Pv) = Pv — 
PPv = Pv — Pv = 0, vemos que v — Pv £ A7(P). Portanto E = A7(P) + 
Im(P). Se w £ A7(P) nlm(P), por um lado tem-se Pw = 0 e, por 
outro, Pw = w; logo w = 0. Assim A7(P) n Im(P) = {0} e tem-se a 
soma direta E = A7(P) ©Zm(P). A última afirmação do enunciado é 
óbvia. □ 
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Exemplo 7.1. Para todo operador linear A: E —> E num espaço 
vetorial de dimensão finita vale a relação dim E = dim ÁÍ[A) + 
dim Im(A). Isto porém não implica que se tenha sempre E = A/"(A)© 
Im(A). Por exemplo, se A: M 2 —> M 2 é definido por A(x,y) = 
(x —y,x —p) então, tomando w = (1,1), temos w = Av, com v = (2,1) 
e A w = 0, logo Af{ A) n Im(A) contém o vetor não-nulo w. 

Outro exemplo de operador linear que está ligado à decomposição 
de um espaço vetorial como soma direta de dois subespaços é forne¬ 
cido pelas involuções. 

Uma involução é um operador linear S: E —> E tal que S 2 = I, ou 
seja, S(Sv) = v para todo v e E. 

Noutras palavras, uma involução é um operador invertível, igual 
ao seu próprio inverso. Um exemplo de involução é a reflexão (orto¬ 
gonal) no plano em torno de uma reta que passa pela origem. 

Veremos agora que toda involução é a reflexão em torno de um 
subespaço, paralelamente a outro. 

Teorema 7.3. Seja S: E —> E uma involução. Os conjuntos Fi = 
{u € E; Su = u) e E 2 = {v G E; Sv = —v} são subespaços vetoriais e 
E = Ei ©E 2 . Para todo w = u+v, com u € E 1 e v € F 2 tem-se Sw = u—v. 
Além disso, P = |(S + I) é a projeção sobre Ei, paralelamente a E 2 . 
(Veja Fig. 7.2.) 



Figura 7.2. 
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Demonstração: Para todo wéE, podemos escrever w = u+v, onde 
u = (w + Sw)/2 e v = (w — Sw)/2. Como S 2 = I, é claro que Su = u e 
Sv = —v, ou seja, u € Fi e v € F 2 . E claro também que Fi n ¥2 = {0} e 
que w = u + v Sw = u — v se u € Fi e v € F 2 . Finalmente, 

P = 1(S + I) => P 2 = ^(S 2 + 2S + I) 

= ^(2S+2I) 

= 1(S + I) = P. 

Vê-se facilmente que o núcleo de P é F 2 e a imagem de P é Fi. □ 

Na situação descrita pelo Teorema 7.3, diz-se que a involução S é 
a reflexão em torno do subespaço Fi, paralelamente a F 2 . O caso mais 
comum de reflexão é aquele em que se tem dim E = u, dim F] = u— 1 
e dim F 2 = 1, de modo que S é a reflexão em torno do hiperplano Fi 
paralelamente à reta F 2 . 


Exercícios 

7.1. No plano M 2 , considere as retas Fi e F 2 , definidas respectiva¬ 
mente pelas equações y = ax e y = bx, com a / b. Em seguida: 

(1) Exprima cada vetor v = (x,y) e M 2 como soma de um vetor em 
Fi e um vetor em F 2 . 

(2) Obtenha a matriz (em relação à base canônica) da projeção 
P: M 2 —> M 2 , que tem Fi como núcleo e F 2 como imagem. 

(3) Ache a matriz da reflexão S: M 2 —» M 2 , em torno da reta F 2 , 
paralelamente a Fi . 

7.2. Se P, Q: E —> E são projeções e PQ = QP, prove que PQ é uma 
projeção cujo núcleo é AF(P) +AF(Q) e cuja imagem éXm(P) nXm(Q). 

7.3. Exprima um vetor arbitrário v = (x,y, z) G M 3 como soma de um 
vetor do plano Fi , cuja equação éx + y — z = 0 , com um vetor da reta 
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F 2 , gerada pelo vetor (1,2,1). Conclua que R 3 = Fi © F 2 . Determine 
a matriz (relativa à base canônica) da projeção P: R 3 —* M 3 , que tem 
imagem F] e núcleo F 2 . 

7.4. É dado um operador linear P: E —> E. Assinale verdadeiro (V) 
ou falso (F): 

( ) Se E = © Im(P) então P é uma projeção. 

( ) Se E = jV(P) +Im(P) então P é uma projeção. 

( ) Se P é uma projeção então I — P também é. 

( ) Se P é uma projeção então Im(P) = J\í[l — P) e AA(P) = 
Xm(I-P). 

7.5. Se AA(P) = Im(I — P), prove que 0 operador linear P: E —> E é 
uma projeção. 

7.6. Mostre que 

1 0 a b 

0 1 c d 

0 0 0 0 

_0 0 0 0 _ 

é a matriz (na base canônica) de uma projeção P: R 4 —» R 4 . Escreva 

as equações que definem 0 núcleo e a imagem dessa projeção. 

7.7. Prove que 0 operador P: R 2 —> R 2 , dado por P(x, y) = (—2x — 
4y, jx + 3y) é a projeção sobre uma reta. Determine 0 núcleo e a 
imagem de P. 

7.8. Considere 0 operador linear A: R 3 —» R 3 , dado por 

A(x,y,z) = (40x + 18y — 6 z, 18x + 13y + 12z, — 6 x + 12y + 45z). 

Mostre que P = ^ • A é uma projeção, que Im(P) é um plano e 
determine a equação desse plano. 

7.9. Sejam Fi, F 2 subespaços vetoriais de E, com dim Fi + dim E 2 = 
dim E (dimensões finitas). Prove que E = F] © F 2 se, e somente se, 

Fi n f 2 = { 0 }. 
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7.10. Seja A: E —> E um operador linear num espaço vetorial de 
dimensão finita. Prove que E = JV[A) © Xm(A) se, e somente se, 

Aí[A) =A/'(A 2 )- 

7.11. Suponha que o espaço vetorial de dimensão finita E admita 

a decomposição E = Fi © ■ • • © Ek, como soma direta de subespaços 
vetoriais. (Vide Exercício 2.33.) Para cada i = 1,..., k, escreva Gt = 
Ei © • • • © Et^i © Eí + i © ■ ■ • © Et e chame de Pt: E —> E a projeção sobre 
Et, paralelamente a Gt. Prove que PH-b Pk = I e PiPj = 0 se i / j. 

7.12. Sejam Pi,...,Pk: E —> E operadores lineares tais que 
Pi + • • • + Pk = I e P t Pj = 0 se i / j. Prove que esses operadores 
são projeções. 

7.13. Sejam P, Q: E —> E projeções. Prove que as seguintes afirma¬ 
ções são equivalentes: 

(a) P + Q é uma projeção; 

(b) PQ + QP = 0; 

(c) PQ = QP = 0. 

[Para provar que (b) => (c), multiplique à esquerda, e depois à 
direita, por P.] 

7.14. Prove que o produto de duas involuções é uma involução se, e 
somente se, elas comutam. 

7.15. Mostre que os seguintes operadores são involuções e 
determine, em cada caso, a projeção correspondente na forma do 
Teorema 7.3. 

(a) S: JQR 2 ; R) -> .F(R 2 ; R), Sf = f*, f* (x, y) = f(y, x). 

(b) U: .X(R + ;R) -> JQR+jR), Uf = f, f(x) = f(l/x). 

(c) V: R n —> R n , V(xi,...,Xn) = (-xi,..., -x k ,Xk+i>... ,x n ). 

7.16. Se o espaço vetorial E tem dimensão finita, prove que para 
todo subespaço E c E existe (pelo menos) um subespaço G c E tal 
que E = F © G. 
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7.17. Seja E = Fi © ? 2 - O gráfico de uma transformação linear 
A: Ei —* E 2 é 0 subconjunto G C E formado pelas somas v + Av, onde 
v € Ei. Prove que G é um subespaço vetorial de E e que a projeção 
P: E —> Fi, restrita a G, define um isomorfismo entre G e Fi. Recipro¬ 
camente, se G c E é um subespaço vetorial tal que a restrição de P 
a G é um isomorfismo de G sobre Ei, prove que G é 0 gráfico de uma 
transformação linear A: Fi —» E 2 . 

7.18. Diz-se que X U Y = Z é uma partição de Z quando X n Y = 0. Se 

JUK = {l,...,n}é uma partição, prove que R n = R T © R K , onde R T e 
R K são os subespaços vetoriais de R n gerados pelos vetores e,, j e J e 
pelos vetores e^, k e K respectivamente. Seja FcM n um subespaço 
vetorial. Prove que existe uma partição J U K = {1,..., n} tal que F 
é 0 gráfico de uma transformação linear A: K k , onde dim E = 

número de elementos de J. 

7.19. Seja P: E —> E uma projeção. Prove que os vetores v e (1 — t)v + 
tPv, para todo v e E e todo tel, têm a mesma imagem por P. 

7.20. Sejam P, Q: E —> E projeções. Se P + Q for ainda uma projeção, 
prove que Im(P + Q) = Im(P) © Im(Q). Considerando as projeções 
P, Q: R 2 —> R 2 , com P(x,y) = (x,0) e Q(x,y) = |(x + y,x + y), mostre 
que a recíproca é falsa. 

7.21. Prove que todo espaço vetorial de dimensão finita é soma di¬ 
reta de subespaços de dimensão 1. 
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A Matriz de uma 

Transformação Linear 

/ 


A matriz de uma transformação linear é um objeto concreto, asso¬ 
ciado a essa transformação na presença de bases em seu domínio e 
seu contra-domínio. A matriz permite obter uma variedade ilimi¬ 
tada de exemplos de transformações lineares, bem como calcular es¬ 
pecificamente a imagem de um dado vetor por uma transformação. 
Nesta seção será estudada a relação entre uma transformação linear 
e sua matriz. Em particular, o produto de transformações conduzirá 
a uma profícua noção de produto de matrizes. Veremos como se re¬ 
lacionam as matrizes da mesma transformação tomadas em bases 
diferentes e daremos uma demonstração direta da igualdade entre o 
posto-linha e o posto-coluna de uma matriz. 

Vimos na Seção 4 que uma transformação linear A: M n —> R m 
fica inteiramente determinada pela matriz a = [aq] e M(mxn), cujo 
ij-ésimo termo aq é a i-ésima coordenada do vetor A • ej € M m . Com 
efeito, conhecendo essa matriz tem-se, para cada v = (xi,... ,x n ) € 
M n , o valor A ■ v = (qi,... ,y m ) dado por 

m = anxi H-h a in x n (i = 1,..., m). 

Estenderemos agora essas considerações a uma transformação li¬ 
near entre dois quaisquer espaços vetoriais de dimensão finita. 

Sejam E, F espaços vetoriais de dimensão finita e A: E —» F uma 
transformação linear. Fixadas bases V = {vi,..., v n ) c E e W = 
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{wi ,..., w m } c E, para cada j = 1,..., n o vetor Avj se exprime como 
combinação linear dos vetores da base W: 


m 


Avj = apW] + a 2 jW 2 H-F a mj w m = a ij w í • 

i=l 


Assim, a transformação linear A: E — > F juntamente com as bases 

V C F e W C F determinam uma matriz a = [aq] € M(m x n), 
chamada a matriz de A relativamente a essas bases (ou nas bases 
V,W). 

Por definição, a j-ésima coluna da matriz a é formada pelas coor¬ 
denadas de Avj em relação à base W. 

Embora isso não seja mencionado explicitamente, convém salien¬ 
tar que os vetores nas bases V e W são dispostos numa ordem fixa, 
sem o que a matriz a não ficaria bem definida. 

No caso em que A: E —> E é um operador linear, a menos que seja 
feita menção explícita em contrário, considera-se apenas uma base 

V = (vi,..., v n } C E e a matriz a = [aq] do operador A relativamente 
à base V (ou na base V) é definida pelas n igualdades 


n 




Neste caso, a e M(n x n) é a matriz quadrada n x n cuja j-ésima 
coluna é formada pelas coordenadas do vetor 


Avj = aqV! + a 2 jV 2 H-F a nj v n 


na base V. 

Quando considerarmos uma transformação linear A: M n —> M m 
e dissermos apenas a matriz de A, estaremos significando a matriz 
de A relativamente às bases canônicas de M n e M m . Caso utilizemos 
outras bases, isto será dito explicitamente. 

Exemplo 8.1. Consideremos um espaço vetorial E, de dimensão 
finita. Dado oc e M, seja A: E —> E o operador linear definido por Av = 
av para todo v e E. Relativamente a qualquer base V = {vi,..., v n } c 
E, a matriz a do operador A é sempre a mesma, com números <x na 
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diagonal e zeros fora dela: 

oí 0 • • • 0 
0 oí ■ ■ ■ 0 


0 0 • • • oí 


O operador A = ai é o que se chama uma homotetia de razão oí. 
Estes são os únicos operadores cujas matrizes independem da base 
dada. (Vide Exercício 8.35.) 

Exemplo 8.2. Seja P: E — > E a projeção sobre o subespaço Fi, pa¬ 
ralelamente ao subespaço ¥ 2 . Sejam ainda Vj C Fi e V 2 C ¥2 bases 
quaisquer desses subespaços. Então V = Vi U V 2 é uma base de E, 
relativamente à qual a matriz p de P tem os k primeiros termos da 
diagonal iguais a 1 (k = dim Fi) e todos os demais termos (sobre a 
diagonal ou fora dela) iguais a zero. Analogamente, se S: E —> E é a 
reflexão em torno de Ei paralelamente a E 2 , sua matriz s na base V 
tem os primeiros k termos da diagonal iguais a 1, os restantes iguais 
a — 1 e todos os termos fora da diagonal iguais a zero. 

A fixação das bases V C E e W c F determina portanto uma 
transformação 

cp: £(E;F) —> M(m x n), 

que faz corresponder a cada A e £(E;F) sua matriz a nas bases V, 
W. A transformação cp é linear, ou seja, se a,b € M(m x n) são 
as matrizes de A, B e £(E;F) respectivamente e a, |3 são números 
reais, então a matriz deA + Béa + b, a matriz de cxA é aa e, mais 
geralmente, a matriz de cxA + |3B é aa + (3b. Mais ainda, cp é um 
isomorfismo: a bijetividade de cp é assegurada pelo Teorema 4.1. 

Convém observar que, no caso de E = I n e F = M m , existe um 
par natural de bases (canônicas) nestes espaços, de modo que 0 iso¬ 
morfismo cp: —> M(mx n) pode ser definido sem depender 

de escolhas arbitrárias. A cada transformação linear A: M n —> R m 
corresponde a matriz cp(A) = [aq] cujo j-ésimo vetor-coluna é A • e, = 

(ülj, . . . , Qmj)- 

Em particular, a cada funcional linear f: M n —> M corresponde, 
de modo natural, uma matriz [ai,...,a n ] € M(1 x n) ou, 0 que é 
0 mesmo, um vetor (ai,..., a n ). As correspondências entre a ma¬ 
triz [ai,..., a n ] e 0 funcional f tal que f (et) = a^, e entre f e 0 vetor 
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(ai, ..., cL n ), são isomorfismos entre M(1 x n), (M n )* e M n , determi¬ 
nados pela base canônica de M n . 

Entre transformações lineares, além das operações A + B e <xA, 
existe também a multiplicação BA. O isomorfismo cp faz correspon¬ 
der ao produto BA o produto ba das matrizes de B e de A, segundo 
definiremos a seguir. 

Sejam u = (oq,..., a n ) e v = (|3i,..., |3 n ) vetores em M n . O pro¬ 
duto interno de u por v é definido como o número 

(u,v) = Oqpi H-h «npn- 

A noção geral de produto interno, suas propriedades e aplicações 
serão estudadas na Seção 10. Um caso particular será usado agora 
para introduzir o produto de duas matrizes. 

Sejam b = [by] e M(m x n) e a = [ay] € M(u x p) matrizes 
tais que o número de colunas de b é igual ao número de linhas de 
a. O produto da matriz b pela matriz a (nesta ordem) é a matriz 
ba = c = [cy] € M(m x p), cujo ij-ésimo elemento 

n 

Cij = bu ay + b i2 a 2 j H-h b in a nj = Y_ bikQkj 

k=1 

é o produto interno do i-ésimo vetor-linha de b pelo j-ésimo vetor- 
coluna de a. 

Exemplo 8.3. Uma transformação linear A: M n —> M m pode ser 
interpretada como uma multiplicação de matrizes: em vez de A € 
considera-se sua matriz a = [ay] € M(m x n). Em par¬ 
ticular, os funcionais lineares f: M n —> M são substituídos por ma¬ 
trizes 1 x n, ou seja, por vetores-linha. Além disso, os vetores x = 
(xi,..., x n ) € M n e b = (bi,..., b m ) passam a ser considerados como 
matrizes nx 1 e mx 1 respectivamente, ou seja, como vetores-coluna. 
Então a igualdade Ax = b passa a ser escrita sob a forma ax = b, 
isto é: 


" a 11 

0-ln 


xi¬ 


"bi" 

a 2 i • 

Aín 


xi 

= 

b2 


Q-mn_ 


_Xn_ 


bm. 


Dentro deste ponto de vista, a Álgebra Linear se reduz ao cálculo 
de matrizes, o que traz vantagens sob o aspecto computacional mas 
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o custo é a perda da intuição geométrica, da simplicidade conceituai, 
além da impossibilidade de se tratar o caso de dimensão infinita. 

A definição do produto de matrizes foi formulada de modo a tor¬ 
nar verdadeiro o teorema seguinte. Nele, A:E—íFeB:F-> G são 
transformações lineares, U = {ui,..., u p } c E, V = {vi,..., v n } C E e 
W = {wi,..., w m } c G são bases, a e M(u x p) é a matriz de A nas 
bases U, V e b e M(m x n) é a matriz de B nas bases V, W. 

Teorema 8.1. A matriz de BA: E —* G nas bases U, W é o produto 
ba € M.(m x p) das matrizes b e a. 

Demonstração: Por definição, temos 

n 

Auj=^a kj v k (j = 1,...,p) 
k=l 


Bv k = ^b ík Wi (k = 1,..., n). 

i=1 

Seja c = [et,] € M(m xp) a matriz de BA nas bases U, W. Por 
definição, para cada j = 1,..., p, temos: 


i=1 


Y Cij Wi = BAuj = B í Y_ cikjVk J = Y_ Q kjBv k = 

\k=1 / k=1 

m / n \ n r m 

= Y. aic ) ( Y- bikWí = Y Y- bikQk i 


k=l 


, 1=1 


i=1 k=l 


Wj . 


Igualando os coeficientes de cada w i; concluímos que, para i=l,..., m 
e j = 1,... ,p, tem-se 

n 

Cíj = ) bi k a k j, 

k=1 

logo c = ba. □ 

Resulta imediatamente do teorema acima e do isomorfismo 
(p: £(E;E) —> M(mxn) que as regras operacionais do produto de 
transformações lineares se transferem diretamente para o produto 
de matrizes. No que se segue, indicaremos com o símbolo I n a matriz 
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identidade n x n. Tem-se I n = [6q], onde õq é o símbolo de Kronec- 
ker\ õij = 0 se i / j e 5 Ü = 1. Quando não houver ambigüidade, 
escreveremos simplesmente I em vez de I n . 

As propriedades abaixo listadas se provam considerando, para 
cada a e M(m x n), a transformação linear A: M n —> R m cuja matriz 
é a e aplicando a propriedade correspondente para transformações 
lineares, já provada anteriormente. 

1) (cb)a = c(ba); 

2) c(a + b) = ca + cb; (b + c)a = ba + ca; 

3) a • I n = a, I m • a = a se a € M(m x u); 

4) b(oca) = <x(ba). 

Dada a € M.(m x n), diz-se que x e M(n x m) é uma matriz 
inversa à esquerda de a quando xa = I n e que y € M(n x m) é uma 
matriz inversa à direita de a quando ay = I m . 

5) Uma matriz mx n possui inversa à esquerda se, e somente se, seus 
vetores-coluna são L.I. e uma inversa à direita se, e somente se, esses 
vetores-coluna geram R m . 

Uma matriz a chama-se invertível quando é quadrada e existe 
uma matriz a -1 , chamada a inversa de a, tal que a -1 a = aa 1 = I. 

6) Se uma matriz a possui uma inversa à esquerda x e uma inversa 
à direita y então a é quadrada, é invertível e x = y = a -1 . 

7) Uma matriz quadrada a admite uma inversa à esquerda se, e 
somente se, admite uma inversa à direita. Neste caso, a matriz a é 
invertível e cada uma dessas inversas laterais é igual a a -1 . 

A seguir, determinaremos como varia a matriz de uma transfor¬ 
mação linear A: F —> F quando se mudam as bases em E e F. 

Sejam V = {vi,..., v n } c E e W = {wi,..., w m } c F bases, em 
relação às quais a matriz da transformação linear A: E —> F é a = 
[ciij] e M(m x n). Isto significa que 


m 




Tomando novas bases V' = {v^,..., v^J cEelV' = {w \,..., w' m } c F, 
a transformação linear A tem nova matriz a' = [a'-] € M(m x n), 


Seção 8 


A Matriz de uma Transformação Linear 89 


definida por: 

m 

Av- = Y a! r] w' r (j = 1,...,n). (*) 

r=1 

Para obter a relação entre as matrizes a e a', consideramos as 
matrizes de passagem p = [picj] £ M(n x n) e q = [qi r ] € M(m x m), 
definidas pelas igualdades 

n m 

vj = F PkjVk e w' r = Y_ qirWi . 

k=1 i=1 

Por definição, p é a matriz de passagem da base V para a base V e 
q é a matriz de passagem da base W para a base W. Cada um dos 
dois membros da igualdade (*) pode ser escrito separadamente, em 
termos da base W, assim: 

n n m 

Av- = Y_ Pk) Av k = Y Pfcj Y QikWí 

k=1 k=l i=1 

n m 

=ll Pkj Qik Wi 

k=l i—1 

ÍTI 


i=1 

m mm 

Y a rj' v r = Y a í j Y C l irWl 

r=1 r=1 i=1 

m m 

= H a lj ( lirWi 

r=1 i=1 

m / m \ 

= Y\ Y ^ a rj Wí • 

i=1 \r=1 / 

Igualando os coeficientes de wi vem: 

n m 

0-i.kPkj = 9ir a rj > 

k=l r=1 




isto é, ap = qa'. 
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Observemos agora que toda matriz de passagem é invertível. 
Com efeito, se p é a matriz de passagem da base V para a base V 
então p é também a matriz (em relação à base V) do operador linear 
P: E —> E, tal que Pvj = vj (j = 1,..., u), o qual é invertível porque 
leva uma base numa base. 

Assim, da igualdade ap = qa' podemos concluir 

a ' = q 1 ap. 


Esta é a fórmula que nos dá a matriz a' de A nas bases V', W em 
função da matriz a de A nas bases V, W. No caso particular de um 
operador A: E —> E e de suas matrizes a, a' relativas às bases V, V', 
temos uma única matriz de passagem p, que nos dá 

a' = p 1 ap. 


As duas matrizes quadradas a e p 1 ap dizem-se semelhantes. 
Assim, as matrizes do mesmo operador em relação a bases diferentes 
são semelhantes. Vale também a recíproca: se a e a' = p 1 ap são 
matrizes n x n semelhantes então existe um operador A: M n —> M n 
tal que a e a' são matrizes de A relativamente a bases distintas 
de R n . 

Com efeito, dadas a e a' = p 1 ap, consideramos o operador 
A: M n —> M n cuja matriz na base canônica £ de M n é a. Em seguida, 
consideramos a base £' c M n , obtida da base canônica pela matriz 
de passagem p. Então a' é a matriz de A na base £'. 

Para efeitos práticos é útil observar que se V = (vi,..., v n ) é uma 
base em M n então a matriz de passagem da base canônica para V é 
aquela cujas n colunas são os vetores vi,..., v n . 

Exemplo 8.4. Seja A: M 2 —> M 2 o operador linear que consiste na 
reflexão em torno da reta y = ax. Como se viu no Exemplo 4.4, a 
matriz de A relativamente à base canônica de M 2 é 


1—a 2 

2a 1 

l+a 2 

1+a 2 

2a 

a 2 —1 

Ll+a 2 

1+a 2 _ 


Seja V = {vi,V 2 } c M 2 a base formada pelos vetores vi = 
v 2 = (—a, 1). Para todo vetor v = (x,y) € M 2 , temos 


/ 1 — a 2 2a 2a a 2 — 1 \ 

VTT^ X + TT? y ’TT^ 2X + TT? y J ’ 


(l,a) e 


A(x,y) 
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logo Avi = vi e Av 2 = —V 2 - (De resto, estas igualdades são geometri¬ 
camente óbvias.) Portanto a matriz de A na base V é 


A matriz de passagem da base canônica de M 2 para a base V é 


1 —a 


P = 


a 


Segue-se que a' = p 1 • a • p. Neste caso, foi mais simples calcular a' 
diretamente do que determinar p 1 e efetuar a multiplicação p 1 ap. 



(Observação: p 1 = 


Seja A: E —> F uma transformação linear entre espaços vetori¬ 
ais de dimensão finita. O posto de A é a dimensão da sua imagem. 
Evidentemente, dim Zm(A) < dim F. Além disso, pelo Teorema do 
Núcleo e da Imagem, dim 2rn(A) < dim E. Segue-se que o posto de 
A não excede dim E nem dim F. O posto de A é igual à dimensão 
de E se, e somente se, A é injetiva. E é igual à dimensão de F se, e 
somente se, A é sobrejetiva. 

Se a e M(m x n) é a matriz de A relativamente a um par qual¬ 
quer de bases U c E, V C F, o posto de A é a dimensão do subespaço 
de M m gerado pelas colunas de a. Logo, o posto de A é o número 
máximo de colunas linearmente independentes da matriz a. 

Esta observação nos leva a definir o posto segundo colunas de 
uma matriz a G M(m x n) como o número máximo de colunas line¬ 
armente independentes em a. Este número é igual à dimensão do 
subespaço vetorial de M m gerado pelos vetores-coluna de a. ( Espaço- 
coluna de a.) 

De maneira análoga, definimos o posto segundo linhas da matriz 
a E M(m x n) como o número máximo de linhas L.I. em a, ou seja, 
como a dimensão do subespaço vetorial de M n gerado pelos vetores- 
linha da matriz a. ( Espaço-linha de a.) 

Embora o espaço-coluna e o espaço-linha da matriz a sejam sub- 
espaços de espaços vetoriais diferentes, vale o resultado seguinte: 

Teorema 8.2. Para toda matriz a E M(m x n), o posto segundo 
linhas e o posto segundo colunas são iguais. 
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Demonstração: Seja p o posto segundo colunas da matriz a = 
[ay] € M(m x n). Então existem p vetores Wk = (bik,..., b m k) € M m 
tais que cada uma das colunas vj = (aq, ..., a m j), 1 < j < n, é 
combinação linear dewi,...,w p : 

p 

v i=Y- Ck > Wk ’ 1 < j < tl. (*) 

k=l 

Tomando a i-ésima coordenada de cada um dos membros de (*), ve¬ 
mos que 

p p 

CUj = Y_ c kj b ik = Y- bikCk Í ’ (**) 

k=1 k=1 

para quaisquer i, j, com 1 < i < m e 1 < j < u. Considerando agora 
os vetores-linha ui = (au, ..., at n ) da matriz a, juntamente com os 
vetores Zk = (cki,..., Ckn), 1 < k < p, observamos que a igualdade 
entre o primeiro e o terceiro membro de (**) significa que, para todo 
i = 1 ,..., m tem-se 

p 

Ui = Y_ > 1 < i < m. 

k=l 

Assim, os vetores-linha de a são combinações lineares de z \,..., Zp, 
portanto o posto de a segundo linhas é < p. Aplicando este resultado 
à matriz a T (chamada a transposta de a), que tem como linhas as 
colunas de a e como colunas as linhas de a, concluímos que o posto 
de a segundo colunas é menor do que ou igual ao posto segundo 
linhas. Isto conclui a demonstração. □ 

Podemos então definir o posto de uma matriz como o número 
máximo de linhas, ou de colunas, L.I. dessa matriz. Mesmo quando 
a matriz é quadrada (em cujo caso suas linhas e colunas pertencem 
ao mesmo espaço R n ) os subespaços gerados pelas linhas e pelas 
colunas, respectivamente, podem ser diferentes mas têm a mesma 
dimensão. 

Exemplo 8.5 (Uma aplicação do Teorema 8.2.) Sejam fi, ...,f m :E —> 
M funcionais lineares não-nulos no espaço vetorial E, de dimensão 
n. Vimos no Exemplo 6.10 que, para cada i = 1,..., m, o núcleo de 
fi é o subespaço vetorial, de dimensão n — 1, Efi = {v € E;ft(v) = 0} 
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(hiperplano em E). A interseção desses m hiperplanos é o subespaço 
vetorial F = Hi n ... n H m , formado pelos vetores v € E que cum¬ 
prem simultaneamente as condições fi(v) = 0, = 0. Qual 

é a dimensão do subespaço F? Usando o Teorema 8.2 (juntamente 
com o Teorema do Núcleo e da Imagem), mostraremos agora que 
dim F = n — r, onde r é o número máximo de elementos linear¬ 
mente independentes no conjunto {f i ,..., f m }, isto é, a dimensão do 
subespaço de E* gerado por estes funcionais. 

Com efeito, fixemos uma base V = {vi,...,v n } c E e seja 
[au ,..., at n ] a matriz de nesta base (i = 1 ,..., m). Temos ay = 
fi(vj). Isto nos dá uma matriz a = [ay] € M(m x u), cuja i-ésima 
linha é a matriz de f i; logo o posto de a segundo linhas é r. Segue- 
se do Teorema 8.2 que os vetores-coluna wi,..., w n de a geram um 
subespaço de dimensão r em R m . Ora, o subespaço gerado em R m 
pelos wj é a imagem da transformação linear A: E —> R m , definida 
por Av = (f] (v),..., f m (v)), para todo v e E. De fato, 

Avj = (fi(Vj),...,f m (Vj)) 

- (uij,...,a mj ) = wj, j = 1,2,..., n. 

Evidentemente, o núcleo de A é o subespaço F. Resulta então do 
Teorema do Núcleo e da Imagem que dim F = dim E — dim Xm(A) = 
n — r. 

Exemplo 8.6. O espaço-linha e o espaço-coluna da matriz 

'1 T 

2 2 

são duas retas distintas em R 2 . 


Exercícios 

8.1. Determine a matriz do operador linear A: R 2 —> R 2 , relativa¬ 
mente à base canônica, sabendo que A(l,l) — (2,3) e A(—1,1) = 

(4,5). 

8.2. O produto vetorial de dois vetores v = (x,y,z) e w = (x^y^z 7 ) 
em R 3 é, por definição, o vetor v x w = (yz' — zy', zx' — xz', xy' — yx'). 
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Fixado o vetor u = (a,b,c), determine a matriz, relativamente à 
base canônica, do operador A: M 3 —> M 3 , definido por A • v = v x 
u. Descreva geometricamente o núcleo desse operador e obtenha a 
equação da sua imagem. 

8.3. Determine a matriz do operador de derivação D: V n —> V n rela¬ 
tivamente à base {1, t, t 2 ,..., t n }. 

8.4. Considere os subespaços vetoriais F e G do espaço C°°(M), cujas 
bases são, respectivamente, os conjuntos {cos x, sen x} e 

(e x cos x, e x sen x, e 2x cos x, e 2x sen x, e 3x cos x, e 3x sen x}. 

Determine a matriz do operador de derivação em cada um desses 
subespaços. 

8.5. Seja A: E —* F uma transformação linear de posto r entre 
espaços vetoriais de dimensão finita. Prove que existem bases U = 
{ui,..., u n } c E e V = {vi,..., v m } c F, relativamente às quais a 
matriz a = [aq] de A tem an = ■ ■ • = a rr = 1 e os demais aq = 0. 

8.6. Ache o valor de x para o qual operador P: M 3 —> M 3 , cuja matriz 
na base canônica é 

ri _i ii 
2 2 2 
-1 0 1 
_1 -1 X 

L 2 2 Al 

seja uma projeção. 

8.7. Qual é a matriz, na base canônica, do operador A: M 2 —> M 2 tal 
que A(2,3) = (2,3) e A(-3,2) = 0? 

8.8. Calcule a n-ésima potência da matriz ^ < j L . 

8.9. Seja E = Fi © F 2 . Dado 0 operador linear A: E —> E, defina 
transformações lineares An : Fi —> Fi , A 2 i : Fi —> F 2 , A 12 : F 2 —> F] e 
A 22 : F 2 —> F 2 tais que, para todo vsvi +v 2 € E, com vi € Fi e v 2 € F 2 , 
seja 

Av = (An + A 21 )vi + (A 12 + A 22 )v 2 . 

An A 12 
A 2 i A 22 


Diz-se então que 
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é a matriz do operador A relativamente à decomposição E = Fi ® F 2 . 
Dado outro operador linear B: F —> F, determine a matriz de BA 
relativamente à mesma decomposição. 

8.10. Com a notação do exercício anterior, sejam a e b as matrizes 
de A e B respectivamente, em relação a uma base U^VMÁiC. E, onde 
U\ C Fi e Ui c F 2 são bases. Mostre que se 

. bn bi 2 

|b 21 b 22 

bnai2 + bi 2 a 2 2 
b2iai2 + b22a22_ 

(Multiplicação por blocos de matrizes.) 

8.11. Seja a uma matriz 5x5 cujos elementos sobre a diagonal e 
abaixo dela são iguais a zero. Sem fazer nenhum cálculo, conclua 
que a 5 = 0. 

8.12. Sejam a uma matriz m x n, com m < n, e b uma matriz n x m. 
Podem ab e ba ser ambas invertíveis? Uma delas? Qual? Quando? 

8.13. Assinale verdadeiro (V) ou falso (F): 

( ) Se A, B: F —> F são operadores de mesmo posto r então 0 pro¬ 

duto BA tem posto r. 

( ) Se as matrizes a,b € M(m x u) têm 0 mesmo espaço-coluna 

então elas são matrizes da mesma transformação linear. 

( ) A matriz do operador linear A: F—>E na base {vi,V2,V3,...,v n } 

difere da matriz do mesmo operador na base {v 2 ,vi,V 3 ,... ,v n } 
pela permutação das duas primeiras colunas. 

( ) Sejam a € M(2 x 3) e b € M.(3 x 2). Se ab = I 2 então ba = I 3 . 

( ) Se a matriz a' se obtém da matriz a por uma permutação de 
suas linhas então a' e a têm 0 mesmo posto. 

8.14. Seguindo a orientação ali fornecida, prove as propriedades 1) 
a 7) da multiplicação de matrizes listadas após a demonstração do 


então 


ba 


an ai2 
»2i a 2 2 


bnan +b 12 a 2 i 
b 2 ian +b 2 2a 2 i 
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Teorema 8.1. Em particular, prove que se a e b são matrizes u x u 
com ba = I n então se tem também ab = I n . (Cfr. Corolário do 
Teorema 6.7.) 

8.15. Sejam dados os vetores vi,...,v n G M n . Se, para cada j = 
1,..., n, o j-ésimo vetor da base canônica de M n se exprime como 


ej = xijVi H-+ x nj v n , 


prove que x = [xq] é a inversa da matriz que tem vi,...,v n como 
vetores-coluna. 

rir 0" 


8.16. Determine a inversa da matriz 

0 G M(r x s). 


a L 


onde a € M(s x r) e 


8.17. Sejam a G M(m x m) uma matriz de posto rebe M(u x u) 
uma matriz de posto s. Prove que a matriz (m + n) x (m + n) abaixo 
tem posto r + s: 

a 0 
0 b 

O símbolo 0 na primeira linha significa a matriz nula m x n e, na 
segunda linha, 0 G M(u x m). 

8.18. Dadas a G M(m x m), b G M(u x n) e c G M(m x n), com posto 
de a = r e posto de b = s, que postos pode ter a matriz abaixo? 


a c 
0 b 


8.19. Seja 


a b 
c d 


, com b/0, a matriz de um operador A: 


na base canônica. Ache uma base de M 2 na qual a matriz de A seja 


0 1 
bc — ad a + d 

8.20. Determine a matriz da projeção P: M 2 —> R 2 , P(x,y) = (x,0) 
relativamente à base {u, v} c M 2 , onde u = (1,1) ev = (1,2). 

8.21. Sabendo que a matriz do operador A: M 3 —> M 3 relativamente 
à base {u,v,w} c M 3 , onde u = (l,l,l),v = (1,2,1), w = (1,1,3), é 


1 

2 


' 3 
0 

-1 


1 

2 

-1 


3 

0 

-1 
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determine a matriz de A relativamente à base canônica de R 3 . 

8.22. Obtenha bases U c R 2 e V C R 3 relativamente às quais a 
matriz da transformação linear A: R 2 -) l 3 , dada por A(x,y) = (2x+ 
y,3x — 2y,x + 3y), tem as linhas (1,0), (0,1) e (0,0). 

8.23. Suponha que os operadores lineares A, B: E —> E têm a mesma 
matriz a = [aq] em relação a duas bases U,V c E. Prove que existe 
um isomorfismo C: E —> E tal que B = CACA 1 . 

8.24. Seja A: R 2 —> R 2 o operador cuja matriz na base canônica é 

' 0 T 
-1 0 • 

Prove que se 


a = 


an 

U2i 


0-12 

0-22 


é a matriz de A relativamente a uma base qualquer de R 2 então 
Qi2 / 0 ou a 2 i / 0. (Noutras palavras, nenhuma matriz de A é 
diagonal.) 


8.25. Considere as transformações lineares 


A: R n+1 —> P n , A(oc 0 , <xi,..., a n ) = <x 0 + oqx H-h a n x n 


B :P n -> K n+1 , B.p(x) = (p(0),p(l),... ,p(u)). 

Determine a matriz de BA: R n+1 R n+1 (na base canônica) e prove 
que é uma matriz invertível. 

8.26. Seja a a matriz n x n cujas linhas são os vetores vi = (1,2,... 
...,n), V 2 = (n + 1, n + 2,..., 2u), etc. Prove que o posto de a é igual 
a 2 e que o subespaço de R n gerado por suas linhas coincide com o 
subespaço gerado por suas colunas. 

8.27. Prove que uma matriz c = [cq] € M(m x n) tem posto 1 se, 
e somente se, existem vetores não-nulos a = (a 1 ,...,a m ) £ R m e 
b = (bi,..., b n ) € R n tais que cq = a^bj para todo i e todo j. 
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8.28. Assinale V(erdadeiro) ou F(also): 

( ) Toda matriz é soma de matrizes de posto 1. 

( ) O conjunto das matrizes de posto k em M(m x n) é um subespa- 
ço vetorial. 

( ) A matriz 

X] X2 ... X n 

yi Vl ••• t)n 

tem posto 2 se, e somente se, existem i, j tais que xtyj / Xjy^. 

( ) Se A: E —> E é um operador linear de posto 1 então E = A/"(A) © 
Xm(A). 

8.29. Prove que uma matriz m x n tem posto r se, e somente se, é 
possível selecionar r linhas e r colunas (porém não mais) de modo 
que os elementos comuns a elas formem uma matriz invertível r x r. 
[Sugestão: reduza ao caso r = min{m, u} e aplique o Teorema 8.2.] 

8.30. Sejam fi,..., f m : E —> R funcionais lineares no espaço vetorial 
E de dimensão n. Suponha que estes funcionais gerem em E* = 
£(E;R) uma variedade ahm de dimensão r. Prove que o conjunto E, 
formado pelos vetores veE tais que 

fl(v) = f 2 (v) = • • ■ = f m (v), 

é um subespaço vetorial de dimensão n — r + 1. 

8.31. Uma matriz n x n chama-se um quadrado mágico quando a 
soma dos elementos de cada uma de suas linhas, de cada coluna, 
da diagonal principal e da outra diagonal (ao todo 2n + 2 somas) 
são iguais. Prove que, se n>3, o conjunto Q n dos quadrados mágicos 
nxn é um subespaço vetorial de dimensão n 2 —2n do espaço M(nxn). 
[Sugestão: use os Exercícios 8.30, 3.32 e 3.33.] 

8.32. Em conformidade com o exercício anterior, determine os 8 ele¬ 
mentos restantes da matriz 4x4 abaixo, de modo a obter um qua¬ 
drado mágico 

'12 3*' 

4 5 6 * 

7 8 * * 

* * * * 
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8.33. Calcule o posto da matriz 

'1 2 3' 

4 5 6 
2 1 0 _ 

e mostre que o subespaço gerado por suas linhas é diferente daquele 
gerado por suas colunas. 

8.34. Obtenha números a, b, c tais que ax + by + cz = 0 seja a 
equação do plano gerado pelas colunas da matriz 

'1 1 T 
12 3. 

2 3 4 


8.35. Seja A: E —> E um operador linear no espaço vetorial E, de 
dimensão finita. Supondo que A não seja um múltiplo do opera¬ 
dor identidade, mostre que existem bases de E do tipo {v, Av,...} e 
{v, 2Av,...}. Relativamente a estas bases, as matrizes de A são di¬ 
ferentes. Conclua que os operadores od são os únicos cuja matriz 
não depende da base escolhida e que as matrizes do tipo cd n são as 
únicas que comutam com todas as matrizes invertíveis n x n. 

8.36. Seja a uma matriz triangular (isto é, ay = 0 se i < j) nxn cujos 
elementos da diagonal são todos iguais a zero. Mostre que a n = 0. 
[Sugestão: considere o operador A: M n —> M n cuja matriz na base 
canônica é a.] 

8.37. O traço de uma matriz quadrada a = [ay] € M(n x n) é a soma 
tr a = an + • • • + a nn dos elementos da sua diagonal. Prove que 
tr (ab) = tr (ba) e conclua que todas as matrizes do mesmo operador 
A: E —> E, num espaço E de dimensão finita, têm o mesmo traço, o 
qual se indica com a notação tr A. 

8.38. Prove que o traço de um operador linear idempotente P: E —\ E 
é um número inteiro, igual ao seu posto. 

8.39. Seja c = [cy] € M(n x n) uma matriz de posto 1. Prove que 
c 2 = (tr c).c e, mais geralmente, para todo n > 1, c n = (tr c) n-1 c. 
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8.40. Sejam U, V e W bases finitas do espaço vetorial E. Se p e q são 
respectivamente as matrizes de passagem de U para V e de V para 
W, prove que as matrizes de passagem de U para WedeV para U 
são respectivamente pq e p 1 . 

8.41. Prove que o posto da transformação linear BA é menor do que 
ou igual ao posto de A e ao posto de B. Dê um exemplo em que posto 
de A = posto de B > posto de BA. 

8.42. Dada a transformação linear A: E —> F, entre espaços de di¬ 
mensão finita, sejam Ei c E e F] c E subespaços tais que E = 
AT[A) © Ei e E = Im(A) © Fi. Tome bases U C E e V C E cujos 
primeiros elementos formam respectivamente uma base de M[A) e 
uma base de Im(A). Que forma tem a matriz de A relativamente a 
UeV? 

8.43. Sejam A:E —> F e B: F —> G transformações lineares entre 
espaços vetoriais de dimensão finita. Se B é injetiva, prove que o 
posto de BA é igual ao posto de A. Que condição sobre A assegura 
que o posto de BA seja igual ao de B? 

8.44. Se E tem dimensão finita, prove que não existem operadores 
lineares A, B: E —» E tais que AB — BA = I ou tais que AB — BA seja 
uma projeção. (Use o traço. Compare com o Exercício 5.13.) 

8.45. Sejam V, V' C E, e W, W C E bases finitas, e p, q as matrizes 
de passagem de V para V' e de W para W' respectivamente. Dada 
a transformação linear A: E —> F, sejam a e a' respectivamente as 
matrizes de A relativamente às bases V, W e V', W. Mostre que p é 
a matriz de U nas bases V', V e q é a matriz de I F nas bases W', W. 
Use as igualdades A = AIe e A = A para provar que ap e qa' 
são iguais à matriz de A nas bases V', W. Obtenha assim uma nova 
dedução da fórmula a' = q 1 ap. 

8.46. Prove que uma matriz quadrada de posto 1 é idempotente se, 
e somente se, seu traço é igual a 1 . 
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Eliminação 

/ 


Esta seção trata de aspectos computacionais dos assuntos tratados 
até aqui. Do ponto de vista do encadeamento lógico, sua leitura não 
é necessária para o entendimento das seções seguintes. (Salvo no que 
tange à Seção 17 que, por sua vez, quase nada influi nas que lhe se¬ 
guem.) Entretanto seu valor educativo é inestimável pois exibe um 
processo simples e bem sucedido para responder a perguntas natu¬ 
rais sobre subespaços, transformações lineares, sistemas de equações 
e matrizes. 

Estudaremos a seguir algumas questões de natureza prática que 
serão resolvidas com o uso do tradicional e eficiente método de eli¬ 
minação. 

9.A. Dimensão do subespaço gerado por m vetores 

A primeira questão que abordaremos é o problema de determinar 
a dimensão do subespaço gerado por m vetores vi,..., v m no espaço 
vetorial E que, por simplicidade, (porém sem perda de generalidade) 
suporemos ser o espaço euclidiano M n . Noutras palavras, queremos 
achar o número r tal que r dos vetores dados são linearmente inde¬ 
pendentes porém os demais são combinações lineares deles. 

O princípio básico a ser utilizado é a observação óbvia de que 
se um dos vetores dados, digamos vi, tem uma de suas coordena- 
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das, por exemplo a j-ésima, diferente de zero mas todos os demais 
vetores V 2 , têm a j-ésima coordenada nula então vi não é 

combinação linear de V 2 ,..., v m . Resulta então do Teorema 3.2 (ou 
melhor, da observação logo após) que se cada um dos vetores não- 
nulos wi,..., w T tem uma coordenada diferente de zero e a mesma 
coordenada é zero em todos os vetores seguintes a ele nesta lista 
então {wi,..., w r } é L.I.. 

Exemplo 9.1. Sejam vi = (0,1,2,3,4), V 2 = (0,0,1,2,3), e V 3 = 
(0,0,0,0,1). Neste caso, a segunda coordenada de vi é 1 mas as 
segundas coordenadas de vi e V 3 são nulas. A terceira coordenada de 
V 2 é 1 mas a terceira coordenada de V 3 é zero. Logo {vi,V 2 ,V 3 } cl 5 é 
um conjunto L.I.. 

O critério acima enunciado, que garante a independência linear 
dos vetores wi,..., w r e M n , pode ser refraseado assim: a primeira 
coordenada não-nula de cada wt tem índice menor do que a primeira 
coordenada não-nula dos vetores subseqüentes w i+ i,..., w r . 

Se, para cada i = l,...,r, escrevermos W{ = (au,..., at n ), te¬ 
remos uma matriz a = [a^] € M(r x u), cujos r vetores-linha são 
wi,..., w T . Diremos que essa matriz é escalonada quando 0 primeiro 
elemento não-nulo de cada uma de suas linhas está à esquerda do 
primeiro elemento não-nulo de cada uma das linhas subseqüentes e, 
além disso, as linhas nulas (se houver) estão abaixo das demais. 

Com esta definição, podemos dizer que as linhas não-nulas de 
uma matriz escalonada são vetores linearmente independentes, ou 
seja, uma matriz escalonada r x n tem posto r se suas linhas forem 
todas diferentes de zero. 

Exemplo 9.2. As matrizes abaixo são escalonadas: 


'13 7 2' 
0 2 5 1 
0 0 0 3 


0 12 3 1' 
0 0 4 5 2 
0 0 0 6 3 
0 0 0 0 0 


Ambas têm posto 3. 

Dados os vetores vi,..., v m € M n , vamos alterá-los passo a passo 
de tal modo que, em cada etapa, os vetores obtidos geram 0 mesmo 
subespaço que os da etapa anterior e, no final, os vetores resultantes 
formam as linhas de uma matriz escalonada. Os não-nulos dentre 
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eles formarão uma base do subespaço gerado pelos vetores original¬ 
mente dados. 

As seguintes modificações, chamadas operações elementares, le¬ 
vam os vetores vi,..., v m e M n em vetores v',,..., v' m G M n que geram 
o mesmo subespaço: Sfv',,..., v' m ) = S(vi,..., v m ). 

(1) Trocar a posição de dois vetores vt, Vj (í < j) na lista dada. Esta 
operação é esquematizada como 

(v 1 ,...,v i ,...,v j ,...,v m ) !-> (v 1 ,...,v j ,...,v i ,...,v m ). 

(2) Somar a um dos vetores um múltiplo de outro vetor da lista, ou 
seja, substituir Vj por v- = vj + avt, í / j. 

Para justificar a operação (2), sejam V = (vi,...,v m ) e V = 
(vi,... ,v-,... ,v m ). Evidentemente S(V') C S(V). Além disso, como 
vj = vj — avt, segue-se que S(V) C S(V')- Logo V e V geram o mesmo 
subespaço: S(V) = S(V'). 

Em termos da matriz cujas linhas são os vetores dados, estas 
operações elementares se exprimem assim: 

(1) Trocar a posição de duas linhas; 

(2) Somar a uma linha um múltiplo de outra linha. 

Portanto, o subespaço gerado pelas linhas (ou seja, o espaço- 
linha) de uma matriz não se altera quando essas duas operações 
elementares são aplicadas a essa matriz. 

Descreveremos a seguir o processo de eliminação (ou escalona¬ 
mento), o qual, mediante aplicações sucessivas das duas operações 
elementares às linhas de uma matriz, produz uma matriz escalo¬ 
nada. O procedimento é o seguinte: 

(a) Se an / 0, o processo começa deixando a primeira linha intacta 
e somando a cada linha D, com i > 2, a primeira linha multiplicada 
por — ciii/an. Com isto se obtém uma matriz cuja primeira coluna é 

( Q ii > 0,..., 0). 

(b) Se an = 0, uma troca de linhas fornece uma matriz com an /O, 
desde que a primeira coluna não seja nula. Se, porém, todos os ele¬ 
mentos da primeira coluna são iguais a zero, passa-se para a se¬ 
gunda coluna ou, mais geralmente, para a coluna mais próxima, à 
direita da primeira, onde haja algum elemento não-nulo e opera-se 
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como antes, de modo a obter uma matriz cuja primeira coluna não- 
nula começa com elemento / 0 mas todos os demais são iguais a 
zero. A partir daí não se mexe mais na primeira linha. Recomeça-se 
o processo, trabalhando com as linhas a partir da segunda, até obter 
uma matriz escalonada. 

Exemplo 9.3. Sejam os vetores 

vi =(1,2,3,4), 
v 2 = (5,6,7,8) e 
v 3 = (9,10,11,12) 


em M 4 . Indicamos abaixo a seqüência de operações elementares efe¬ 
tuadas sobre a matriz cujas linhas são estes vetores, conduzindo a 
uma matriz escalonada 

'1 2 3 4' 

5 6 7 8 

9 10 11 12 


12 3 4 ' 

0 -4 -8 -12 . 

0 0 0 0 _ 

Como a matriz escalonada final tem duas linhas diferentes de zero, 
os três vetores dados geram um subespaço vetorial de dimensão 2 
em R 4 ewi = (1,2,3,4), wz = (0, —4, — 8, —12) formam uma base 
desse subespaço. 

No exemplo acima, como nos seguintes, a notação L 3 + od_j signi¬ 
fica que a matriz à direita foi obtida da matriz à esquerda somando- 
se à i-ésima linha o múltiplo aLj da j-ésima linha. Analogamente, 
usaremos a notação U <-» Lj para indicar a troca da linha i pela li¬ 
nha j. 

Exemplo 9.4. Consideremos os vetores vi = (0,1,2,3), vi = (2,1, 
3,0), v 3 = (3,4,2,0) e v 4 = (4,2,0,1) em M 4 . Indicamos abaixo a 
seqüência de operações elementares efetuadas sobre a matriz que 


L3-2L2 



1 

2 

3 

4 

1-2—5Ç 

0 

-4 

-8 

-12 

L 3 -9L, 

0 

-8 

-16 

-24 


L3-2L2 
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tem esses vetores como linhas a fim de obter uma matriz escalonada 


'0 

1 

2 

3' 


'2 

1 

3 

0' 


'2 

1 

3 

0' 

2 

1 

3 

0 

L 2 <->Li 

0 

1 

2 

3 

1-3 —§1-1 

0 

1 

2 

3 

3 

4 

2 

0 


3 

4 

2 

0 

L 4 —2L, 

0 

5 

2 

5 

2 

0 

4 

2 

0 

1 


4 

2 

0 

1 


0 

0 

-6 

1 


'2 

1 

3 

0 ' 


'2 

1 

3 

0 ' 

0 

1 

2 

3 

u-lu 

0 

1 

2 

3 

0 

0 

15 

2 

15 

2 

* 

0 

0 

15 

2 

15 

2 

0 

0 

-6 

1 


0 

0 

0 

7 _ 


Concluímos que os quatro vetores dados são L.I., portanto consti¬ 
tuem uma base de M 4 . Além disso, vemos que os vetores wj = 
(2,1,3,0), w 2 = (0,1,2,3), w 3 = (0,0,-f,-^) e w 4 = (0,0,0,7) 
também formam uma base de M 4 . 


9.B. Cálculo do posto de uma transformação linear 

A resposta à questão 9.A permite determinar o posto de uma trans¬ 
formação linear A: M n —> M m e até mesmo uma base para 2m(A). 
Uma tal base pode ser formada pelas colunas não-nulas de uma ma¬ 
triz escalonada, obtida da matriz de A por meio de operações ele¬ 
mentares efetuadas sobre suas colunas. Ou então podemos, como 
acima, operar sobre as linhas da transposta da matriz de A. (Pois 
as linhas da transposta são as colunas da matriz dada.) Não haverá 
confusão se lembrarmos que a base de 2m(A) é formada por vetores 
de M m , não de M n ! Quando m = n, é preciso ter cuidado, pois a ima¬ 
gem de A é gerada pelos vetores-coluna de sua matriz e não pelos 
vetores-linha. 

Exemplo 9.5. Obter uma base para a imagem da transformação 
linear A: M 3 —> M 4 , definida por 

A(x,y,z) = (x + 5y + 9z, 2x + 6y + 10z, 3x + 7y + 1 lz, 4x + 8y + 12z). 

Temos Aei = (1,2,3,4), Ae 2 = (5,6,7,8) e Ae 3 = (9,10,11,12), de 
modo que a imagem de A é gerada pelos vetores vi, v 2 , v 3 do Exemplo 
9.3. Resulta então daquele exemplo que A tem posto 2 e os vetores 
wi = (1,2,3,4), w 2 = (0, —4, —8, —12) formam uma base de Xm(A). 
Note que a matriz que ocorre no Exemplo 9.3 não é a matriz de A e 
sim a sua transposta. 
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9.C. Resolução de sistemas lineares 

O método de eliminação, embora simples e ingênuo, é a maneira 
mais eficaz de resolver um sistema de m equações lineares, com n 
incógnitas, apresentado sob a forma matricial ax = b, onde a € 
M(m x n), x € M(u x l)ebe M(mx 1 ). 

Resulta das noções gerais até aqui estudadas que o sistema ax = 
b possui solução se, e somente se, o vetor b € M m , correspondente à 
matriz b, pertence à imagem da transformação linear A: M n —> M m 
cuja matriz (nas bases canônicas de M n e M m ) é a. 

Dito de outra maneira, o sistema ax = b possui solução se, e 
somente se, o vetor b e M m (correspondente à matriz b) pertence 
ao subespaço gerado pelas colunas de a. Isto equivale a dizer que a 
matriz aumentada [a;b] € M(m x (n + 1 )) tem o mesmo posto que a 
matriz a do sistema. 

Uma afirmação mais completa é a seguinte: o sistema Ax = b 
não possui solução quando b ^ lm(A), possui uma única solução 
quando b e Im(A) e A é injetiva, e possui infinitas soluções quando 
b e Im(A) e A não é injetiva. (Vide Teorema 6.4.) 

Em termos matriciais, o sistema ax = b, com a 6 M(m x n), 
xe M(nx 1 ) ebe M(mx 1 ), admite as seguintes alternativas: 

(1) Não possui solução quando o posto da matriz aumentada [a;b] é 
maior do que o posto de a; 

(2) Possui uma única solução quando a matriz a e a matriz aumen¬ 
tada [a; b] têm o mesmo posto, igual ao número u de incógnitas; 

(3) possui infinitas soluções quando se tem posto [a;b] = posto a = 
r < n. Neste caso, o conjunto das soluções é uma variedade afim de 
dimensão n — r. 

O que acabamos de dizer é mais ou menos um resumo do que 
já vimos antes. Trata-se de uma discussão esclarecedora do ponto 
de vista teórico mas que não ensina como reconhecer, na prática, 
em qual dos casos se enquadra um sistema dado e muito menos 
como obter suas soluções, caso existam. Isto se faz com o método 
de eliminação, escalonando a matriz aumentada do sistema. 

O processo de eliminação se baseia na observação de que ao efe¬ 
tuar uma operação elementar sobre as linhas da matriz aumentada 
[a;b] obtém-se uma matriz [a';b'] que é a matriz aumentada de um 
sistema a'x = b', equivalente ao sistema original ax = b. (Dois sis- 
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temas se dizem equivalentes quando possuem o mesmo conjunto de 
soluções.) 

No final do processo, obtém-se um sistema a'x = b', equivalente 
ao sistema proposto ax = b, no qual a matriz [a';b'] é escalonada. 
(Isto é o mesmo que dizer que a' é escalonada.) O sistema a'x = b' é 
facilmente resolvido de baixo para cima: acha-se primeiro o valor da 
última incógnita, substituindo-a por esse valor na equação anterior 
e assim por diante. 

Vejamos alguns exemplos. 

Exemplo 9.6. Consideremos o sistema 

y + 2z + 3t = 1 
2x + y + 3z =1 

3x + 4y + 2z =1 

4x + 2y + t = 1 

O escalonamento da matriz aumentada é feito abaixo: 


0 12 3 1 

2 13 0 1 

3 4 2 0 1 

4 2 0 11 


'2 13 0 1 ' 

0 12 3 1 

0 0 -f -f -3 

0 0 o" 7 \ _ 

Obtém-se assim a matriz aumentada do sistema 


2 

1 

3 

0 

1 


0 

1 

2 

3 

1 


0 

5 

2 

5 

2 

0 -i 

> 

0 

0 

-6 

1 

-1 



2 

1 

3 

0 

1 

0 

1 

2 

3 

1 

3 

4 

2 

0 

1 

4 

2 

0 

1 

1 


2x + y + 3z = 1 

y + 2z + 3t = 1 



Resolvendo este sistema de baixo para cima, vem: t = z = 
y = 0, x = . Esta é a única solução do sistema dado. Como a matriz 
do sistema tem posto 4, a solução existiria e seria única, fosse qual 
fosse o segundo membro. 
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Exemplo 9.7. Seja o sistema 

x + 2y — 3z = 4 

2x + 3y + 4z = 5 

4x + 7y — 2z = 12. 


O escalonamento da sua matriz aumentada é o seguinte: 


'1 

2 

-3 

4' 


'1 2 

-3 

4 ' 


'1 

2 

-3 

4 ' 

2 

3 

4 

5 

— > 

0 -1 

10 

-3 

— » 

0 

-1 

10 

-3 

4 

7 

-2 

12 


0 -1 

10 

-4 


0 

0 

0 

-1 


Vemos portanto que o sistema dado é equivalente a: 


x + 2y — 3z = 4 

— y + 1 Oz = — 3 

Ox + Oy + Oz = — 1, 

o qual é obviamente impossível. O sistema dado não tem solução. 
[Poderíamos ter chegado à mesma conclusão observando, na forma 
do Exemplo 9.5, que a imagem do operador A: M 3 —> M 3 , cuja ma¬ 
triz tem colunas vi = (1,2,4), vz = (2,3,7) e V 3 = (—3,4,—2), é um 
subespaço de dimensão 2 em M 3 do qual os vetores w 1 = (1,2,4) e 
W 2 = (0,1,1) formam uma base e que 0 vetor b = (4,5,12) certa¬ 
mente não é combinação linear de wi e W 2 .] 

Exemplo 9.8. Seja 0 sistema 

x + 2y + 3z + 4t = 1 

5x + 6 y + 7z + 8 t = 2 

9x + 1 Oy + 11 z + 12t = 3 

O escalonamento da sua matriz aumentada segue 0 esquema: 


'1 

2 

3 

4 

r 


'1 

2 

3 

4 

1 ' 

5 

6 

7 

8 

2 

—> 

0 

-4 

-8 

-12 

-3 

9 

10 

11 

12 

3 


0 

-8 

-16 

-24 

-6 


12 3 4 1 ' 
0 -4 -8 -12 -3 
0 0 0 0 0 
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A última matriz obtida é a matriz aumentada do sistema: 

x + 2y + 3z + 4t = 1 

- 4y - 8z - 12t = -3 

ou 

x + 2y = —3z — 4t + 1 

— 4y = 8z + 12t — 3. 

Este sistema pode ser resolvido de baixo para cima (esquecendo que 
z e t são incógnitas) e nos dá a solução: 

y = -2z-3t+^, x = z + 2t — ^. (*) 

O sistema dado possui portanto uma infinidade de soluções, que po¬ 
dem ser obtidas atribuindo-se valores arbitrários a z e t e calcu¬ 
lando x e y em função delas por meio destas duas últimas igualda¬ 
des. Observe que as igualdades (*) são as equações da variedade 
afim de dimensão 2 no espaço R 4 , formada por todas as soluções do 
sistema dado. Escrevendo o sistema original sob a forma Av = b, 
onde A: R 4 —> R 3 é a transformação linear cuja matriz tem as linhas 
(1,2,3,4), (5,6,7,8), (9,10,11,12) e b = (1,2,3), esta variedade afim, 
formada por todos os vetores 

1 3 

v = (z + 2t— 2z —3t+ -,z,t) € R 4 , 

onde z, t são números reais arbitrários, é o conjunto de todos os 
vetores v e R 4 tais que Av = b. 

Observação: O conjunto F = {(z + 2t, — 2z — 3t, z, t) € R 4 ;z, t € 
R} é um subespaço vetorial de R 4 , núcleo da transformação linear 
A: R 4 —> R 3 acima considerada. Uma base de F é formada pelos ve¬ 
tores W] = (1, —2, 1,0) e W2 = (2, —3, 0,1), obtidos fazendo z = 1, t = 0 
e depois z = 0, t = 1 na expressão dos vetores de F. De um modo ge¬ 
ral, para obter uma base para o núcleo de um operador A: R n —> R m 
o que se tem a fazer é resolver por escalonamento o sistema Ax = 0. 

Exemplo 9.9. Achar uma base para o núcleo da transformação li¬ 
near A:R 5 -)M 3 cuja matriz (nas bases canônicas) é 

12 3 12' 

3 4 5 3 4. 

10-110 


a = 
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O núcleo de A é o conjunto das soluções x = (xi,X 2 ,X 3 ,X 4 ,xs) do sis¬ 
tema linear homogêneo 


X! 

+ 2 x 2 

+ 3x 3 

+ 

x 4 

+ 2x 5 = 

0 

3xi 

+ 4x2 

+ 5x 3 

+ 

3X4 

+ 4x 5 = 

0 

*1 


- *3 

+ 

x 4 

= 

0. 


Para sistemas homogêneos, não há necessidade de considerar a ma¬ 
triz aumentada. O escalonamento da matriz a é feito segundo o 
esquema 


'1 

2 

3 

1 

2 



'1 

2 

3 

1 

2 ' 

3 

4 

5 

3 

4 



0 

-2 

-4 

0 

-2 

1 

0 

-1 

1 

0 



_0 

-2 

-4 

0 

-2 






'1 

2 

3 

1 

2 ' 








0 

-2 

-4 

0 

-2 








0 

0 

0 

0 

0 




Portanto o sistema homogêneo inicial é equivalente ao sistema esca¬ 
lonado 

xi + 2x2 + 3 x 3 + X4 + 2x5 = 0 

- 2X2 - 4x 3 - 2x 5 = 0 , 

ou seja 

xi + 2x2 = — 3 x 3 — X4 — 2x5 

- 2x 2 = 4x 3 + 2x 5 . 

Resolvendo 0 último (considerando X 3 , X 4 e X 5 como conhecidos), vem 
X 2 = — 2 x 3 — X 5 e xi = X 3 — X 4 . Concluímos então que 0 núcleo da 
transformação linear A é formado por todos os vetores x = (X 3 — 
X 4 ,— 2 x 3 — X 5 ,X 3 ,X 4 ,X 5 ), onde os números X 3 , X 4 e X 5 são escolhidos 
arbitrariamente. Uma base do núcleo é obtida quando se faz suces¬ 
sivamente (x 3 ,x 4 ,x 5 ) = ( 1 , 0 , 0 ), (x 3 ,x 4 ,x 5 ) = ( 0 , 1 , 0 ) e (x 3 ,x 4 ,x 5 ) = 
(0,0,1). Explicitamente, essa base é formada pelos vetores wj = 
( 1 ,-2, l, 0 , 0 ),W 2 = (-l, 0 , 0 ,l, 0 )ew 3 = ( 0 ,- 1 , 0 , 0 , 1 ). 
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9.D. O método de Gauss-Jordan 

A quarta aplicação que faremos do método de eliminação é o cálculo 
da inversa de uma matriz (invertível) a € M(nxu). Antes porém de¬ 
vemos advertir que a determinação da inversa não é necessária para 
resolver o sistema ax = b. A expressão x = a -1 • b para a solução 
desse sistema é de grande elegância e significado teórico porém, na 
prática, a obtenção explícita da inversa a 1 requer a solução de n 
sistemas lineares. Convenhamos que isto seria um modo pouco efi¬ 
caz de resolver um único sistema. 

Com efeito, examinando coluna por coluna cada membro da 
igualdade aa 1 = I n , vemos que a j-ésima coluna de a -1 é a solução 
do sistema ax = ep portanto o cálculo da inversa a -1 equivale a 
resolver os n sistemas lineares ax = ei,..., ax = e n . 

O método de eliminação que vimos utilizando é também chamado 
“método de Gauss”. Existe ainda o “método de Gauss-Jordan”. 

Ele continua a eliminação iniciada pelo método de Gauss, che¬ 
gando no final a uma matriz escalonada, com a propriedade adicio¬ 
nal de que, acima e abaixo do primeiro elemento não-nulo de cada li¬ 
nha, todos os elementos são iguais a zero. Se a matriz for (quadrada 
e) invertível, o primeiro elemento não-nulo de cada linha da matriz 
escalonada está sobre a diagonal. Portanto, neste caso, o método de 
Gauss-Jordan produz uma matriz cujos elementos não-nulos consti¬ 
tuem a diagonal. 

Vejamos um exemplo da eliminação de Gauss-Jordan. 

Exemplo 9.10. No Exemplo 9.4, o método de eliminação de Gauss 
em resumo operou a seguinte transformação por meio de operações 
elementares sobre as linhas: 


'0 

1 

2 

3' 


'2 

1 

3 

0 ' 

2 

1 

3 

0 


0 

1 

2 

3 

3 

4 

2 

0 

* 

0 

0 

15 

2 

15 

2 

4 

2 

0 

1 


0 

0 

0 

7 _ 


O método de Gauss-Jordan continua, aplicando as operações ele¬ 
mentares sobre as linhas, de modo a anular também os elementos 
de cada coluna situados acima da diagonal. Ele prossegue a partir 
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daí com as seguintes operações elementares: 


'2 

1 

3 

0 ' 


'2 

0 

1 

-3' 

0 

1 

2 

3 

Li-y 

0 

1 

2 

3 

0 

0 

15 

2 

15 

2 


0 

0 

15 

2 

15 

2 

0 

0 

0 

7 _ 


0 

0 

0 

7 _ 


l,+^l 3 

l 2 +^l 3 



'2 

0 

0 

-4 

l,+^l 3 

0 

1 

0 

1 

G+^l 3 

0 

0 

15 

2 

15 

2 

0 

0 

0 

7 



'2 

0 

0 

0' 

Ll +7L4 

0 

1 

0 

0 

1-2—7 G 

0 

0 

15 

2 

0 

l 3 + Ü L 4 

0 

0 

0 

7 


Esta última matriz diagonal resulta portanto da matriz inicial 
pela aplicação sucessiva de operações elementares sobre suas linhas. 

Existe ainda uma terceira operação elementar, que não tivemos 
ainda ocasião de mencionar porque não foi necessária até agora, mas 
que tem também a propriedade de, aplicada às linhas de uma ma¬ 
triz, não alterar o seu espaço-linha. Ela é a seguinte: 


(3) Multiplicar uma linha por um número / 0. 

Aplicando essa operação às linhas da matriz final do exemplo 
acima, obtemos a matriz identidade. (Multiplique a primeira linha 
por 1 /2, a terceira por —2/15 e a quarta por 1 /7.) 

O método de Gauss-Jordan fornece imediatamente a solução do 
sistema ax = b sem necessidade de, no final, efetuar a resolução de 
baixo para cima. Com efeito, depois de efetuada qualquer seqüência 
de operações elementares (inclusive a terceira) sobre as linhas da 
matriz aumentada obtemos sempre um sistema equivalente a x = 
b'. Se a matriz a é invertível, o processo de Gauss leva a uma matriz 
escalonada com elementos todos / 0 na diagonal. Prosseguindo a 
partir daí com Gauss-Jordan, chegaremos finalmente a um sistema 
a'x = b', equivalente ao original, com a' = I n , logo x = b', o que nos 
dá a solução x diretamente. 

Assim, a solução do sistema ax = b é a última coluna da ma¬ 
triz [a';b'] que se obtém aplicando a eliminação de Gauss-Jordan à 
matriz aumentada [a;b] de modo a chegar com a' = I n . 

Em particular, tomando b = e, (j-ésimo vetor da base canônica de 
M n ), a solução x da equação ax = e,, que é a j-ésima coluna de a -1 , 
se obtém efetuando operações elementares sobre as linhas da ma¬ 
triz aumentada [a;e/ até reduzi-la a [I n ;x]. Como essas operações 
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dependem apenas da matriz a mas não de j, isto sugere o tópico 
seguinte 


9.E. Método prático para calcular a inversa a 1 

Acrescenta-se a matriz identidade I n à direita de a, de modo a ter 
uma matriz aumentada n x 2 u: 


a n 

0-12 • ■ 

■ - a ln 

I 1 

0 .. 

.. 0' 

<121 

<122 • ■ 

■ • <l2n 

1° 

I ; 

1 ., 

.. 0 

CLnl 

a n 2 • ■ 

■ • «Tin 

lo 

0 .. 

.. 1 


Em seguida aplicam-se operações elementares às linhas dessa ma¬ 
triz aumentada de modo a reduzir a matriz a à identidade I n , che- 
gando-se a: 

1 0 ... 0 | xn xu ... x ln " 

0 1 ... 0 | X 21 X 22 ... x 2n 

_0 0 ... 1 I x nl x n2 ... x nn _ 

A matriz [xtj] à direita é a inversa de a. 

Exemplo 9.11. Damos abaixo um exemplo de como obter a inversa 
de uma matriz segundo este método. 


'2 

4 

3 

1 1 

0 

0 ' 



2 

4 

3 

1 

0 

0 ' 


0 

1 

-1 

10 

1 

0 

-> 

0 

1 

-1 

o 

1 

0 


— > 

_3 

5 

7 

10 

0 

1 



0 

-1 

5 

2 

_3 

2 

0 

1 


2 

4 

3 1 

1 

0 

0 ' 


'2 

0 

7 1 

1 

-4 

0 ' 


0 

1 

-1 1 

0 

1 

0 

—> 


0 

1 

-1 1 

0 

1 

0 


0 

0 

5 1 
2 1 

3 

2 

1 

1 



0 

0 

1 1 

3 

2 

1 

1 




'2 0 0| 8 -f 


o 

o 

1 

'Hw 

, 1 

_1 

0 1 01-1 f | 

-» 

0101-1 1 1 

_0 0 | | 1 1 


0 0 11-1 1 1. 


Portanto 


'2 

4 

3 ' 



r 4 _12 _zi 

3 3 

0 

1 

-1 


= 

:] i i 

L 1 3 3 j 

3 

5 

7 
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Retornaremos ao asssunto de eliminação gaussiana no item final 
da seção 17. 


Exercícios 

9.1. Determine o posto da matriz 

'1 2 3 4' 

5 6 7 8 

9 10 11 12 

13 14 15 17 


9.2. Ache a matriz, na base {ui, 1 x 2 , 113 , 14}, da projeção P: M 4 —> M 4 , 
P(x,y,z, t) = (x,y,0, 0), sabendo que ui = (2,0,3,4), u 2 = ( 1, 1,4,2), 
113 = (3,2,2,0) e 114 = (0,3,0,1). [Sugestão: use eliminação gaussi¬ 
ana para exprimir e-\ , e 2 , e 3 e e 4 como combinações lineares de ui , 
U 2 , U 3 e U 4 .] 


9.3. Exprima cada um dos vetores da base canônica de M 3 como 
combinação linear dos vetores vi = ( 1 , 1 , 0 ), V 2 = (— 1 , 0 , 2 ), v 3 = 

'1 -1 41 

(4,2, —5) e, a partir daí, obtenha a inversa da matriz 


1 0 

0 -2 


9.4. Decida se as matrizes abaixo são invertíveis ou não. No caso 
afirmativo, determine a(s) inversa(s). Caso uma delas (digamos a) 
não seja invertível, ache uma matriz x £ M(3 x 1) tal que ax = 0: 


'1 

2 

3' 


'1 

2 

3' 

4 

5 

9 

e 

4 

5 

6 

1 

3 

4 


1 

3 

4 


9.5. Calcule a dimensão do subespaço vetorial de M 5 gerado pelos 
vetores vi = (2,4, 8 ,-4,7), v 2 = (4,-2,-1,3,1), v 3 = (3,5,2,-2,4) e 
v 4 = (—5,1,7, — 6 ,2). Decida se 0 vetor b = (6,18,1, —9, 8 ) pertence ou 
não a esse subespaço. 
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9.6. A matriz a € M(mxn) tem apenas uma linha e uma coluna não- 
nulas. Dada b € M(m x 1), quais são as dimensões possíveis para 
a variedade afim formada pelas soluções x e M(nx 1) do sistema 
ax = b? 

9.7. Exprima cada vetor do conjunto {u, v, w, z} C E como combinação 
linear dos vetores {w, u + 3z, v — 2u + 3w, 5z}. 

9.8. Obtenha uma base para o subespaço vetorial gerado por cada 
um dos seguintes conjuntos e, conseqüentemente, determine a di¬ 
mensão daquele subespaço: 

(a) {(1,2,3,4), (3,4,7,10), (2,1,3,5)} 

(b) x 3 + 2x 2 + 3x+4, 5x 3 + 4x 2 + 3x + 2, 4x 3 —2x 2 + x, 7x 3 + 2x 2 — 3x —8 

(c) (1,3,5), (-1,3,-1), (1,21,1) 

(d) (1,2,3), (1,4,9), (1,8,27). 


9.9. Mostre que se 0, 1, a, b, c são números dois a dois diferentes 
então os vetores (1,1,1,1), (a, a 2 , a 3 , a 4 ), (b,b 2 , b 3 , b 4 ) e (c, c 2 , c 3 , c 4 ) 
são linearmente independentes. Generalize. 

9.10. Exiba uma base para a imagem de cada uma das transforma¬ 
ções lineares abaixo e determine seu posto. 

(a) A: M 4 —> M 3 , A(x,y,z,t) = (x + 2y — t, 2x — z + 2t, —2x + y + 3z) 

(b) B: M 4 —> M 5 , B (x, y, z, t) = (x + 2y + 2z — t, 2x + 4y + 3z +1, —3x + 
2z + 3t, —3x + z + 6t, 1 Ox + 2y + 5z + 5t) 

(c) C: M 3 —> M 3 , C(x,y,z) = (x + 3y,2y + 4z,x + y — 4z) 

(d) D: V n —> V n , Dp(x) = p^x). 


9.11. Use escalonamento para resolver os seguintes sistemas linea- 
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res: 









X 

+ 


+ 

z 

= 

1 



2x 

+ 


+ 

9z 

= 

7 



2x 

+ 


+ 

8z 


6 



X 

+ 

V 



■ 

t 

— 

0 

X 

+ 

2y 

+ 

z 

+ 

t 

= 

1 

3x 

+ 


+ 

z 

+ 

2t 

= - 

-1 



y 

+ 

3z 

— 

t 

= 

3 

X 

+ 

y 

_ 

z 

+ 

2t 

= 0 




3y 

— 

z 

+ 

3t 

= 0 


2x 

— 

y 

— 

z 

+ 

t 

= 0 



9.12. Ache uma condição envolvendo a, b, c para que o sistema 
abaixo tenha solução e encontre as soluções no caso em que elas 
existam 

x + y + z + t= a 

5y + 2z + 4t = b 

3x — 2y+z — t=c 

9.13. Ache uma base para o núcleo de cada uma das transformações 
lineares a seguir: 

(a) A: R 3 —> R 3 , A(x,y, z) = (—3y + 4z,3x — 5z, —4x + 5y). 

(b) B: M 4 —> R 5 , B(x, y,z, t) = (2x — 2z + 4t,x — 2z + 3t,4y + 2z + 
t, 6x + 4y — 4z + 13t, 2x + 4y — 2z + 7t) 

(c) C: R 4 —> R 3 , C(x,y,z, t) = (2x+y—z+3t, x—4y+2z+t, 2y+4z—t). 

(d) T:V^V, T-p(x) =p(x + m),m/0. 


9.14. Decida quais das matrizes abaixo possuem inversa e calcule a 
inversa quando existir. 


1 2 
3 4 


'4 2 3' 
4 5 6 
7 8 8 


'1 

2 

3 

4' 


'1 

1 

1 

r 

5 

6 

7 

8 


2 

3 

2 

i 

9 

10 

11 

12 


3 

1 

1 

2 

4 

3 

2 

1 


1 

2 

1 

3 
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9.15. Prove que o sistema 


X 

+ 


+ 

3z 

— 

3t 

2x 

— 


— 

3z 

+ 

12t 

7x 

+ 

y 

+ 

8z 

+ 

5t 


admite solução se, e somente se, 37a+13b = 9c. Ache a solução geral 
do sistema quando a = 2 e b = 4. 

9.16. Prove que toda matriz anti-simétrica 3x3 não-nula tem posto 
igual a dois. Dê exemplo de uma matriz anti-simétrica invertível 
4x4. 

9.17. Considere o sistema de n equações lineares a n incógnitas: 

Xi + x i+1 =ai (i = l,...,u- 1), xi+x n = u n . 

(a) Se n é ímpar, prove que ele possui solução única, sejam quais 
forem os a^. Explicite esta solução. 

(b) Supondo n par, obtenha condições sobre os que sejam 
necessárias e suficientes para que o sistema possua solução. 
Caso existam soluções, determine a variedade afim por elas 
formada. 
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Produto Interno 


O produto interno, que já foi mencionado brevemente antes, na de¬ 
finição do produto de duas matrizes, será apresentado formalmente 
nesta seção e adotado sistematicamente a partir daqui. Trata-se de 
uma noção que completa e enriquece a estrutura de um espaço ve¬ 
torial, permitindo a utilização de uma linguagem geométrica alta¬ 
mente sugestiva e o destaque de tipos especiais de operadores, os 
quais admitem uma análise mais profunda de suas propriedades, 
como se verá a seguir. 

Os axiomas de espaço vetorial não são suficientes para abordar 
certas noções geométricas como ângulo, perpendicularismo, compri¬ 
mento, distância, etc. Isto se torna possível com a introdução de um 
produto interno. 

Um produto interno num espaço vetorial E é um funcional bi- 
linear simétrico e positivo em E. Mais precisamente, um produto 
interno é uma função E x E —> R, que associa a cada par de veto¬ 
res u, v € E um número real (u, v), chamado o produto interno de u 
por v, de modo que sejam válidas as seguintes propriedades, para 
quaisquer u, u',v,v' € E e ot e R: 

Bilinearidade: (u + u',v) = (u,v) + (u',v), (au,v) = <x(u,v), 
(u,v + v') = (u,v) + (u,v'), (u, <xv) = <x(u,v); 

Comutatividade (simetria): (u,v) = (v, u); 
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Positividade: (u, u) > 0 se u / 0. 

Como (0,v) = (0 + 0,v) = (0,v) + (0,v), segue-se que (0,v) = 
(v, 0) = 0 para todo veE. 

Resulta da positividade que se (u, v) = 0 para todo v € E então 
u = 0. Com efeito, se fosse u / 0 teríamos (u,v) / 0 pelo menos 
quando v = u. 

Segue-se desta observação que se u, u' e E são vetores tais que 
(u,v) = (u',v) para todo v e E então u = u'. Com efeito, isto implica 
que (u — u', v) = 0 para todo v € E, logo u-u' = 0eu = u'. 

O número não-negativo |u| = sj (u, u) chama-se a norma ou o 
comprimento do vetor u. Com esta notação, tem-se |u| 2 = (u, u) e a 
igualdade 


(u + V, u + v) = (u, u) + (u, v) + (v, u) + (v, v) 


lê-se: |u + v| 2 = |u| 2 + |v| 2 + 2 (u,v). 

Quando |u| = 1 diz-se que u € E é um vetor unitário. Todo vetor 
u ytz o se escreve como u = |u| • u', onde u' é um vetor unitário. Basta 


pôr u' = |u| 1 • u. 


Exemplo 10.1. No espaço euclidiano M n , o produto interno canônico 
dos vetores u = (oq, ..., a n ) e v = (|3i,..., |3 n ) é definido por (u,v) = 

oq Pi -I-+ tXnPn- Este é o produto interno que consideraremos em 

M n , salvo aviso em contrário. 

Exemplo 10.2. Consideremos M 2 como o modelo aritmético do plano 
euclidiano, no qual se introduziu um sistema de coordenadas carte¬ 
sianas. Dados u = (<xi, oíz) e v = (pi, P 2 ), os números 



e 



medem realmente os comprimentos das flechas que representam es¬ 
ses vetores. Suponhamos u / 0, v / 0 e chamemos de 0 0 ângulo 
formado por essas flechas. Afirmamos que 0 produto interno (u,v) = 
oq Pi + CX 2 P 2 acima definido é igual a |u| |v| cos 0. Isto será provado 
em três passos: 1-) Se os vetores u e v são perpendiculares, então 
(u,v) = 0 = |u| |v| cos 90°. Com efeito, por um lado, 


|u + v| 2 = (u + V, u + v) = |u| 2 + |v| 2 + 2 (u, v) 





120 Produto Interno 


Seção 10 


e por outro lado, pelo Teorema de Pitágoras, 

|u + v| 2 = |u| 2 + |v| 2 . 



Figura 10.1. 


Logo (u,v) = 0. 2-) Se |u| = |v| = 1 então (u,v) = cos 0. Com 

efeito, tomando o vetor unitário u* perpendicular a u temos, pela 
definição de seno e cosseno, v = cos 0 • u + sen 0 • u*. (Fig. 10.2.) 



Figura 10.2. 


Tomando o produto interno de ambos os membros desta igualdade 
por u vem (u,v) = cos 0 • (u, u) + sen 0 • (u,u*). Como (u,u) = 1 e 
(u, u*) = 0 pelo primeiro passo, temos (u,v) = cos 0. 3-) Caso ge¬ 

ral: pomos u = |u| -u' e v = |v| V, onde ví = (l/|u|)u ev' = (1/|v|)v são 
vetores unitários. Então (u,v) = |u| |v| (u',v') = |u||v|cos 0. Vemos, 
em particular, que os vetores u, v formam um ângulo agudo quando 
(u,v) > 0, um ângulo obtuso quando (u,v) < 0 e um ângulo reto 
quando (u,v) = 0. 
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Exemplo 10.3. Seja E = C°([a, b]) o espaço vetorial cujos elementos 
são as funções contínuas g, f: [a, b] —> M. Um produto interno em E 
pode ser definido pondo 


<f> 9> 


'b 

fWg(x) dx. 
Ja 


Neste caso, a norma da função f é 


|f| = \ f (x) 2 dx. 


Este produto interno é utilizado no estudo das séries de Fourier. 

Observação. Seja E um espaço vetorial de dimensão finita arbitrá¬ 
rio. Dada uma base {ui,..., u n ) c E, podemos definir um produto 
interno em E pondo, para u = Loqui e v = Z(3iUt, (u,v) = ZcqPi, 
por definição. Isto mostra que todo espaço vetorial de dimensão fi¬ 
nita pode ser munido de um produto interno. (Fato verdadeiro em 
geral, pois qualquer espaço vetorial possui base, mas não entrare¬ 
mos nesse terreno.) Assim, quando nos referirmos a um espaço mu¬ 
nido de um produto interno, não estaremos com isso atribuindo uma 
propriedade especial a esse espaço mas apenas dizendo que, entre 
os possíveis produtos internos que nele podem ser introduzidos, um 
particular foi escolhido e fixado. 

Seja E um espaço vetorial com produto interno. Dois vetores 
u, v g E chamam-se ortogonais (ou perpendiculares) quando (u, v) = 
0. Escreve-se, então, u 1 v. Em particular, 0 é ortogonal a qualquer 
vetor de E. Um conjunto XcE diz-se ortogonal quando dois vetores 
distintos quaisquer em X são ortogonais. Se, além disso, todos os ve¬ 
tores de X são unitários então X chama-se um conjunto ortonormal. 
Portanto, o conjunto X c E é ortonormal se, e somente se, dados 
u,v € X tem-se (u,v) = 0 se u / v e (u, v) = 1 se v = u. Uma base 
ortonormal é uma base de E que é um conjunto ortonormal. 

Teorema 10.1. Num espaço vetorial E com produto interno, todo 
conjunto ortogonal X de vetores não-nulos é L.I.. 
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Demonstração: Sejam vi,... ,v n € X. Temos (vq vj) = 0 se i / j. Se 
cxivi + • • • + ot n v n = 0 é uma combinação linear nula desses vetores 
então, para cada i = 1,2,..., n, tomamos o produto interno de ambos 
os membros desta igualdade por ví e temos 


ai (v!,vt) H-b a n (v n ,Vi) = 0, 


logo cti(vi,Vi) = cq|vi| 2 = 0 pois todos os produtos internos (vj,vt), 
com j 7 b i, são nulos em virtude da ortogonalidade de X. Além disso, 
como os vetores pertencentes ao conjunto X são todos não-nulos, re¬ 
sulta de cxilvil 2 = 0 que oq = 0. Assim, os coeficientes da combinação 
linear loqvt = 0 são todos iguais a zero e os vetores do conjunto X 
são, portanto, linearmente independentes. O 

Exemplo 10.4. A base canônica {e],..., e n } Cl n é ortonormal: tem- 
se (ei, ej) = ôij, onde 5q = 0 se í / j e 6q = 1 se i = j. No plano M 2 os 
vetores u = (1,1) ev = (—1,1] são ortogonais. Pondo 



0 conjunto |u', v'} cM 2 é uma base ortonormal. 

Quando u e v são ortogonais, a igualdade |u + v| 2 = |u| 2 + |v| 2 + 
2 (u, v) se torna |u + v| 2 = |u| 2 + |v| 2 . Esta é a versão do Teorema de 
Pitágoras para um espaço vetorial com produto interno. 

Num espaço vetorial E com produto interno, seja u um vetor 
unitário. Dado qualquer v e E, 0 vetor (u, v) • u chama-se a projeção 
ortogonal de v sobre o eixo que contém u. A justificativa para esta 
denominação está no fato de que, escrevendo w = v — (u, v) u, tem- 
se v = (u, v) u + w, onde w é perpendicular a u. Com efeito, to¬ 
mando 0 produto interno de u por ambos os membros da igualdade 
w = v — (u, v) u tem-se 


(u,w) = (u,v) - (u,v) (u,u) = (u,v) - (u,v) = 0, 


pois (u, u) = 1. (Fig. 10.3) 
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Quando se tem apenas u / 0, o eixo que contém u é o mesmo 
que contém o vetor unitário u' = u/|u| (= |u| _1 • u). A projeção or¬ 
togonal de v sobre este eixo é, portanto, igual a (u',v) u', ou seja, 
((u,v) / (u, u)) • u. Usaremos a notação 


Pr u (v) 


( u > v ) 

(u, u) 


• u 


para indicar a projeção ortogonal do vetor v sobre o eixo que contém 
o vetor não-nulo u. 

Se z = pr u (v), tem-se v = z + w, com w _L z. Pelo Teorema 
de Pitágoras, |v| 2 = |z| 2 + |w| 2 . Em particular vemos que |z| < |v|, 
isto é, o comprimento da projeção pr u (v) é menor do que ou igual ao 
comprimento de v. 

Ora, a norma do vetor pr u (v) é igual a | (u, v) |/|u|. Segue-se então 
que, para quaisquer u,v € E, tem-se | (u,v) \/\u\ < |v|, ou seja 


I (u, v) | < |u| • |v| (desigualdade de Schwarz). 


A rigor, o argumento acima prova a desigualdade de Schwarz 
apenas no caso em que u / 0. Mas ela é óbvia no caso em que u = 0. 
Logo vale em geral. 

Um importante complemento da desigualdade de Schwarz é que 
vale a igualdade | (u, v) | = |u| |v| se, e somente se, um dos vetores 
u, v é múltiplo do outro. Isto resulta do raciocínio acima pois, no 
Teorema de Pitágoras |v| 2 = |z| 2 + |w| 2 , dizer |v| = |z| significa que 
w = 0 , isto é, que v é múltiplo de u. 

Resulta da desigualdade de Schwarz que num espaço vetorial 
com produto interno a norma satisfaz a desigualdade triangular : 
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Como se trata de números não-negativos, para provar esta desigual¬ 
dade basta mostrar que |u + v| 2 < (|u| + |v|) 2 . Ora, 

|u + v| 2 = (u + V, u + v) 

= |u| 2 + |v| 2 + 2 (u, v) 

< |u| 2 + |v| 2 + 2|u||v| 

= (|u| + |v|) 2 , 

pois (u,v) < |u| |v| pela desigualdade de Schwarz. 

Vale a igualdade |u+v| = |u| + |v| somente quando um dos vetores 
u, v é um múltiplo não-negativo do outro. Com efeito, pelo argu¬ 
mento acima, |u + v| = |u| + |v| ocorre quando (u,v) = |u| |v|, o que 
é óbvio quando u = 0 e implica v = au quando u / 0. Neste caso, 
|u| |v| = (u,v) = ct(u,u) = a|u| 2 , logo cx. > 0. 

Além da desigualdade triangular, a norma goza ainda das se¬ 
guintes propriedades, de imediata verificação: 

|u| > 0 se u/0 e |a • u| = |a| |u|. 

Em particular, | — u| = |u|. 

Observação. Em todo este livro, |a| significa o valor absoluto do 
número a e |u| representa também a norma do vetor u. 

Num espaço vetorial E munido de produto interno, a distância 
entre os vetores u, v é, por definição, d(u,v) = |u — v|. Tem-se 
d(u,u) = 0, d(u,v) > 0 se u / v, d(u,v) = d(v,u) e d(u,w) < 
d(u, v) + d(v, w). 

Mostraremos agora que existem bases ortonormais em todo es¬ 
paço vetorial de dimensão finita provido de um produto interno. 

Mais precisamente, exporemos o processo de ortonormalização 
de Gram-Schmidt, um algoritmo que ensina a passar de uma base 
qualquer {vi,..., v n } c E para uma base ortonormal (ui,..., u n } c E, 
com a importante propriedade de que, para m = 1,..., n, os vetores 
U],..., u m pertencem ao subespaço F m , gerado por vi,..., v m . 

Dada a base {vi,..., v n } c E, obteremos primeiro uma base or¬ 
togonal {wi,..., w n } c E e depois poremos ui = wi /|wi , u n = 
w n /|w n | para chegar à base ortonormalizada {ui,..., u n } c E. 

Começamos o processo tomando wi = vi e prosseguimos por 
indução. Suponhamos já obtidos os vetores não-nulos wi,..., w m , 
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dois a dois ortogonais, gerando o subespaço F m , o mesmo que é ge¬ 
rado por vi,..., v m . Definimos w m+ i pondo 






Figura 10.4. w 3 = v 3 - z 3> z 3 = 


Um cálculo simples mostra que w m+ i é ortogonal a wi,..., w m . 
Além disso, w m+ i / 0 porque v m+ i não pertence ao subespaço F m 
gerado por W],..., w m (ou por vi,..., v m ). E, finalmente, w m+1 per¬ 
tence ao subespaço gerado por {wi,..., w m ,v m+ i}, o qual é igual a 
F m+ i. Isto completa o processo. 

Observamos que se os primeiros m vetores da base {vi,..., v n } c 
E já formarem uma base ortonormal do subespaço por eles gerado 
então o processo de Gram-Schmidt transforma essa base numa base 
ortonormal {ui,..., u n } c E na qual ui = vi,..., u m = v m . 

Segue-se daí que, dado um subespaço vetorial F c E, toda base 
ortonormal de F estende-se a uma base ortonormal de E: basta es- 
tendê-la a uma base qualquer de E e depois ortonormalizar esta 
última por Gram-Schmidt. 

O significado geométrico do processo de Gram-Schmidt é bas¬ 
tante simples e fica ilustrado na figura: se {wi,..., w m ) c E é uma 
base ortogonal então, para todo v € E, o vetor 
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soma das projeções ortogonais de v sobre os eixos dos wt, tem a pro¬ 
priedade de que w = v — zé perpendicular aos vetores wi,..., w m . 
Daí resulta imediatamente que w é perpendicular a todos os vetores 
de F, pois esses vetores são combinações lineares dos w F . O vetor z 
chama-se a projeção ortogonal de v sobre o subespaço F. Escreve- 
se z = pr F (v). (Fig. 10.5.) [Para a fórmula de pr F (v) quando a base 
{w] ,..., w m } c F não é ortogonal, veja os Corolários 1 e 2 do Teorema 
16.1 ou o Exercício 16.7.] 



Figura 10.5. 


Se z' é qualquer outro vetor em F, temos 

V — z! = (v — z) + (z — z'). 

Como z — z' e F, segue-se que (v — z) _L (z — z')- Do Teorema de 
Pitágoras resulta então que |v—z'| 2 = |v — z| 2 + |z—z'| 2 . Em particular, 
|v — z'| > |v — z|. Isto mostra que a distância de v à sua projeção 
z = pr F (v) sobre o subespaço F é menor do que ou igual à distância 
de v a qualquer outro vetor z' e F. Noutras palavras, a projeção 
z = pr F (v) é o vetor mais próximo de v no subespaço F. 

Se {ui,..., u m } c F é uma base ortonormal então a projeção orto¬ 
gonal de um vetor v e E sobre o subespaço F se exprime, de forma 
mais simples, como 

m 

P r F (v) = Y_ (Ui,v)Ui. 

i=1 

Isto está de acordo com a seguinte observação geral: 
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Seja {ui,..., u n } C E uma base ortonormal. Para todo vetor v e E 
tem-se 

n 

v = y_ ( u í’ v ) 

i=1 

Com efeito, v se exprime como combinação linear 

V = Oí] Ui H-h (X n U n 

em termos da base dada. Tomando o produto interno de ambos os 
membros desta igualdade por ui, temos (uqv) = cq (i = l,...,n) 
pois (uí, Uj) = 6tj (= 1 se i = j e = 0 se i / j). 

Assim, as coordenadas de um vetor relativamente a uma base 
ortonormal são os produtos internos desse vetor pelos elementos da¬ 
quela base. 

Se u = LoííUí e v = Ipjiq são as expressões dos vetores u,v € 
E em termos de uma base ortonormal (ui,..., u n } c E, as relações 
(ut,Uj) = ôij implicam imediatamente que 

(n n \ n n 

y «iUi, y_ PjUj ) = Y «iPi (u-uuj) = y_ oq^. 

i=1 j=1 / i,j=1 i=1 

Portanto, quando se referem os vetores de E a uma base ortonormal 
fixada, o produto interno assume a forma (u,v) = Icq|3 u análoga à 
do produto interno canônico de M n . 

Tomando, mais geralmente, uma base arbitrária {yi,..., v n ) c E 
e pondo (vt,Vj) = g t j, o produto interno dos vetores 

n n 

u = y_ oqvi e V = y_ (3jVj 
i=i j=i 

se exprime como 

n 

( u >v) =* y_ gtj aipj • (*) 

y=i 

A matriz g = [gq] e M(n x n) é simétrica, isto é, gg = gjt pois 
(vi,Vj) = (Vj,Vi). Mais ainda: a matriz g é positiva. Isto significa 
que, além de g ser simétrica, para qualquer lista (xi,... ,x n ) de n 
números reais não todos nulos, tem-se 

n 

y_ 9íj > o. 

y=i 
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Reciprocamente, fixada uma base {vi,..., v n } num espaço vetorial 
E (que pode ser, por exemplo, a base canônica em R n ) e dada uma 
matriz simétrica positiva g = [gy] € M(n x n), a igualdade (*) acima 
define um produto interno em E. 


Exercícios 

10.1. Seja E um espaço vetorial com produto interno. Para quaisquer 
vetores u,veE, prove que |u|v + |v|u e |u|v — |v|u são ortogonais. 

10.2. Seja {ui,... ,u n ) c E uma base ortonormal. Prove que, para 

n 

v,w € E arbitrários, tem-se (v,w) = J2 (v,Ui) (w,ut). 

i=l 

10.3. Dado o vetor u = (2,3,6), seja P: M 3 —> M 3 o operador linear 
definido por Pv = pr u (v). Descreva I — 2P geometricamente, escreva 
a matriz da reflexão H = I — 2P e determine o vetor que se obtém de 
w = ( 1 , 1 , 1 ) por reflexão em torno do plano perpendicular a u. 

10.4. Considere a base V = {vi,V 2 ,V 3 } c M 3 , formada pelos vetores 
V] = (1,1,1), V 2 = (1, —1,1) e V 3 = (1, —1, —1). Determine a matriz 
de passagem p, de V para a base ortonormal U = {ui,U 2 ,U 3 }, obtida 
de V pelo método de Gram-Schmidt. Observe que os elementos da 
diagonal de p são números positivos e abaixo da diagonal todos são 
nulos. Generalize. 

10.5. Seja V — (vi,..., v-n.) d R uma base, com Vj — ( oc] j, cx 2 j,..., 
..., ccnj), j = 1,..., n. Seja U a base ortonormal de M n obtida de V 
pelo processo de Gram-Schmidt. Prove que U é a base canônica de 
M n se, e somente se, a,j = 0 para todo i > j e cxu > 0 para todo 
i = l,...,n. 

10.6. Sem fazer cálculo algum, diga quais são as bases obtidas de 
V = (vi, V 2 , V 3 } pelo processo de Gram-Schmidt nos seguintes casos: 

(a) V! = (3,0,0), v 2 = (-1,3,0), v 3 = (2,-5,1); 

(b) Vl =(- 1 , 1 ,0), V 2 = (5,0,0), v 3 = (2, -2,3). 

10.7. Dado 0 vetor unitário u = (ai,..., a n ) € M n , forme a matriz 
a = [ai • aj] € M(u x n). Seja H: M n —> M n 0 operador cuja matriz 
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na base canônica é I n — 2a. Mostre que para todo v € M n tem-se 
Hv = v — 2 (v, u) u e conclua que |Hv| = |v|. 

10.8. Num espaço vetorial com produto interno, o ângulo entre dois 
vetores não-nulos u, v é, por definição, o ângulo 0 = j/u,v), tal que 
0 < 0 < 180° e cos 0 = (u, v) /|u| |v|. Dito isto, e dados os vetores 
u = (3,4), v = (1,— 1) e w = (—1,1), ponha em ordem crescente os 
ângulos -)/u,v), j/u,w) e j/v,w). 

10.9. Sejam u,v € R 2 vetores L.I.. Prove que o vetor |u|v + |v|u está 
contido na bissetriz do ângulo formado por u e v. 

10.10. Seja u = (a, b, c) € R 3 um vetor unitário, com abc / 0. Deter¬ 
mine t de modo que, pondo v = (—bt, at, 0) e w = (act, bct, — l/t), os 
vetores u, v, w sejam unitários e dois a dois ortogonais. 

10.11. Para cada par de vetores u = (x,y), v = (x',y') em R 2 , ponha 
[u,v] = 2xx' — xy' — x'y + 2yy'. Prove que isto define um produto 
interno no espaço vetorial M 2 . 

10.12. Dado o produto interno (u,v) no espaço vetorial E, prove que 
se tem |u + v| 2 + |u — v| 2 = 2(|u| 2 + |v| 2 ) para quaisquer u,v € E. 
Interprete esta igualdade geometricamente. 

10.13. Seja X um conjunto de geradores do espaço vetorial E, onde 
está definido um produto interno. Se os vetores u, v e E são tais que 
(u, w) = (v, w) para qualquer w € X, prove que u = v. 

10.14. Seja {vi,...,v n } uma base no espaço vetorial E, munido de 
produto interno. Dados n números reais arbitrários oq ,..., <x n , prove 
que existe um, e somente um, vetor w e E tal que 


(w,Vt) = (w,V n ) = 0i n . 


10.15. Para toda base V = {vi,..., v n } no espaço vetorial E, dotado de 
produto interno, prove que existe uma única base W = {wi,..., w n } 
C E tal que (wyVj) = 5y (i,j = 1,2, ...,n). Se (vyVj) = ay e 
(wi,Wj) = by, prove que as matrizes a = [ay] e b = [b y ] são inversas 
uma da outra. 


n 



10.16. Suponha que 
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defina, para u = (xi,... ,x n ) e v = (yi,... ,y n ), um produto interno 
em M n . Prove que ai i > 0,..., a nn > 0. 

10.17. Calcule três produtos internos entre os vetores u = (1,0, —1), 
v = (4,1,4), w = (—3,24,—3) e conclua que eles são linearmente 
independentes. 

10.18. Em cada um dos casos abaixo, determine se o conjunto 
{u, v, w} c M 3 é ortonormal, apenas ortogonal ou nenhum dos dois. 

(a) u = (1,2,1), v = (1,—1,1), w = (—1,1,2). 

(b) u = (a, b, c), v = (—b, a, 0), w = (—ac, —bc, a 2 + b 2 ). 

(c) u=l(2,6,3),v = l(3,2,-6),w = l(6,-3,2). 

10.19. Seja ( , } um produto interno no espaço vetorial F. Dado 
um isomorfismo A: F —> F, ponha [u,v] = (Au, Av) para quaisquer 
u,v e E. Prove que [ , ] é um produto interno em E. 

10.20. Dados os vetores u = (2, —1,2), v = (1,2,1) e w = (—2,3,3), 
determine o vetor de M 3 que é a projeção ortogonal de w sobre o plano 
gerado por u e v. 

10.21. Qual é a base ortonormal de M 3 obtida pelo processo de Gram- 
Schmidt a partir da base {u, v, w), onde u = (2,6,3), v = (—5,6,24) e 
w-(9,-1,-4)? 

10.22. Mesma pergunta do exercício anterior para u = (3,4,12), 
v = (7, —8,15) e w = (-15,6,44). 

10.23. Para todo número natural n, prove que a norma do vetor 
v = (n, n + 1, u(n + 1)) G M 3 é um número natural. 

10.24. Aplicando o processo de Gram-Schmidt a um conjunto de 
vetores vi,... ,v m cuja independência linear não é conhecida, prove 
que se obtém o primeiro vetor w r+ i = 0 quando vi,... ,v r são L.I. 
mas v r+ i é combinação linear de vi,..., v r . 

10.25. Fixado o vetor unitário u = (ai,..., a n ) € M n , seja P: M n —> 
M n o operador linear definido por Pv = pr u (v) = projeção ortogonal 
de v sobre o eixo de u. Mostre que P 2 = P, determine o núcleo de 
P, as matrizes de P, de I — P e da reflexão ortogonal 14 = I — 2P em 
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torno do núcleo de P. (A matriz de H é conhecida como uma matriz 
de Householder.) 

10.26. Seja a um vetor não-nulo no espaço vetorial E, de dimensão 
n, munido de produto interno. Para todo bei, prove que o conjunto 
V = {v G E; (v, a) = b} é uma variedade afim de dimensão n — 1. Dado 
v 0 G V, mostre que v € V se, e somente se, v — v Q é ortogonal a a. 

10.27. Sejam u = (xi,X 2 ,x 3 ) e v = (yi,'y 2 )'y 3 ) vetores em M 3 . O 
produto vetorial de u por v é definido como o vetor 


u x v = (x 2 y 3 -x 3 y2,x 3 -yi _x iy3,xiy 2 -* 2 'yi). 

Prove que valem as seguintes propriedades: 

(a) u x v = —v x u; 

(b) u x (v + v') = u x v + u x v'; 

(c) u x (av) = a(u x v); 

(d) u x v = 0 se, e somente se, u e v são L.D.; 

(e) u x v é ortogonal a u e a v; 

(D ei x e 2 = e 3 , e 2 x e 3 = ei, e 3 x e\ = e 2 . 

[Mais detalhes sobre o produto vetorial no livro “Coordenadas no 
Espaço”, do autor, publicado pela Soc. Bras. de Mat.] 

10.28. Seja r = {(1 — t)u + tv;t El}a reta que liga u a v em E, com 
u / v. Dado w G E, prove que, tomando t = (w — u, v — u) /|v — u| 2 
obtém-se o ponto x = (1 — t)u + tv de r mais próximo possível de w, 
ou seja, tem-se |x — w| < |y — w| para qualquer outro ponto y G r. 

10.29. Seja U = {ui,...,u n } c E uma base no espaço vetorial E, 
munido de produto interno. Suponha que, para todo v = xiui + 
• • • + x n u n G E se tenha |v| 2 = x 2 + • • • + x 2 . Prove que a base U é 
ortonormal. 

10.30. Complete os detalhes do seguinte argumento que prova a 
existência de uma base ortonormal em qualquer espaço vetorial E, 
de dimensão n, com produto interno: “Seja U = {ui,...,u r } C E 
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um conjunto ortonormal com o maior número possível de elementos. 
Para todo vetor v e E, o vetor 


r 



é ortogonal a ui,..., u r . Pela maximalidade de U, tem-se w = 0, logo 
U gera E e é uma base ortonormal.” 

10.31. Seja E um espaço vetorial com produto interno. Prove que, 
para quaisquer u,v € E, tem-se | |u| — |v| | < |u — v|. 

10.32. Prove que um operador A: E —> E, num espaço vetorial de 
dimensão finita com produto interno, tem posto 1 se, e somente se, 
existem vetores não-nulos u,b E E tais que Av = (v, a) b para todo 
v e E. (Compare com o Exercício 8.27.) 

10.33. Num espaço vetorial E com produto interno, o cosseno do 
ângulo entre dois vetores não-nulos u, v é definido como cos(u,v) = 
(u,v) /|u| |v|. Prove que se u e v são ortogonais e não-nulos então 
cos 2 (u, u—v) + cos 2 (v, u—v) = 1. (A soma dos quadrados dos cossenos 
dos ângulos agudos de um triângulo retângulo é igual a 1.) 

10.34. Sejam E um espaço vetorial com produto interno, C C E um 
conjunto convexo e a e E um ponto fora de C. Suponha que exis¬ 
tam x 0 ,xi € C com a seguinte propriedade: para todo x € C tem-se 

|a — x 0 | < |a — x| e |a — xi | < |a — x|. Prove que x 0 = xj. 
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Mostraremos, nesta seção, como o produto interno nos permite asso¬ 
ciar a cada transformação linear A: E —> E uma nova transformação 
A *: F —> E, chamada a adjunta de A. (Em espaços sem produto in¬ 
terno também existe uma noção de adjunta, mas aí se trata de uma 
transformação linear P —> E*, do dual de F no dual de E. O produto 
interno nos dá condição de permanecer com E e F. Isto é particu¬ 
larmente interessante no caso de um operador linear A: E —> EJ A 
adjunta nos dá, por assim dizer, uma visão da transformação A sob 
um novo ângulo. Essa mudança de ponto de vista é reveladora, espe¬ 
cialmente quando ocorre a existência de relações entre A e A*. 

Sejam dim E = ne dim E = m. Vimos na Seção 8 que a escolha 
de bases em E e E determina um isomorfismo cp: £(E;E) —> M(m x 
n), portanto o espaço vetorial £(E;F) das transformações lineares 
de E em E tem dimensão mn. Em particular, o espaço E* = £(E;M) 
cujos elementos são os funcionais lineares f: E —> M, chamado espaço 
dual de E, tem dimensão n. Isto implica que E* é isomorfo a E. 
Na realidade, dada uma base V = {vi,... ,v n } C E, existe uma base 
V* = (v*,... ,v*} c E*, chamada base dual de V, onde, por definição, 
para cada vetor v = loqv t € E, tem-se v*(v) = oq. (A verificação 
de que V* C E* é uma base pode ser feita diretamente ou então 
mediante a observação de que cp(v*) = = i-ésimo elemento da 

base canônica de M n , onde cp: E* —> M(1 x u) =K n éo isomorfismo 
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acima mencionado.) Obtém-se um isomorfismo A: E —> E* impondo 
que Avi = v* (i = 1,..., n). 

Uma desvantagem dos isomorfismos entre E e E* obtidos medi¬ 
ante o emprego de uma base é que eles não são intrínsecos: dado um 
vetor v € E, o funcional v* e E* que a ele corresponde depende não 
apenas de v mas também da base de E que se tomou. Esta dificul¬ 
dade, entretanto, desaparece quando E está munido de um produto 
interno, como veremos agora. 

Seja E um espaço vetorial de dimensão finita, dotado de um pro¬ 
duto interno. Definimos uma transformação linear E —> E* fa¬ 
zendo corresponder a cada vetor v e E o funcional linear E • v = v*, 
tal que v*(w) = (w,v) para todo weE. 

A verificação da linearidade de E é imediata: seu,ve E, como 

(u + v)* (w) = (w, u + v) = (w, u) + (w, v) 

= u* (w) + V* (w) 

= [u* + V*] (w) 

para todo w e E, temos (u + v)* = u* + v*. Analogamente, (cxv)* = 
ot-v*. 

Além disso, E é injetiva. Com efeito, dado vgE, sev* = 0 então, 
para todo wéE tem-se 

(w,v) =v*(w) = 0(w) =0. 

Em particular, (v,v) = 0, logo v = 0. 

Finalmente, E: E —> E* é sobrejetiva pois é injetiva e os espaços 
E, E* têm, como vimos, a mesma dimensão. 

Assim, podemos enunciar o 

Teorema 11.1. Seja E um espaço vetorial de dimensão finita, com 
produto interno. A correspondência f: E —> E* que associa a cada 
v g E o funcional linear E(v) = v*, tal que v*(w) = (w,v) para todo 
w E E, é um isomorfismo. 

O teorema acima será usado principalmente na medida em que 
assegura a existência de E 1 . Mais explicitamente: a todo funcional 
linear f: E —> M corresponde um único vetor v = Vf € E tal que 
(w,v) = f(w) para todo w G E. Um tanto informalmente: para se 
conhecer um vetor v € E basta que se conheça o produto interno de 
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todos os vetores w G E por v (desde que esses produtos dependam 
linearmente de w). 

O Teorema 11.1 é responsável pelo pouco (ou nenhum) uso que 
se faz de funcionais lineares em espaços, como M n , onde há um pro¬ 
duto interno: funcionais são substituídos por vetores e a ação de um 
funcional sobre um vetor é substituída por um produto interno. 

De posse do Teorema 11.1, definiremos a adjunta de uma trans¬ 
formação linear A: E —> F onde E, F são espaços vetoriais de di¬ 
mensão finita, ambos munidos de produto interno. 

A adjunta de A deve ser uma transformação linear A*: F —> E tal 
que, para v G F e w G F quaisquer se tenha: 

(Av,w) = (v,A*w). (*) 

Assim, a imagem A*w € F de um vetor arbitrário w e Fé, por 
definição, aquele vetor de F tal que o produto interno de qualquer 
vetor v € F por ele é igual a (Av,w). Como, para cada w G F, o 
número f(v) = (Av,w) depende linearmente de v (ou seja, f é um 
funcional linear), o Teorema 11.1 assegura que o vetor A*w G F 
existe e é único de modo que valha (*) para quaisquer v G F, w G F. 
A correspondência w i—» A*w assim definida é uma transformação 
linear de F em F. Com efeito, dados w,w' G F tem-se, para todo 
v G F: 

(v, A*(w + w 7 )) = (Av, w + w') = (Av, w) + ^AVjW 7 ) 

= (v, A*w) + (v, A*w') = (v, A*w + A*w / ) . 

Assim, A*(w + w') e A*w + A *w' são vetores em F cujos produtos 
internos por qualquer vetor v G E são iguais. Portanto A*(w + w') = 
A*w + A*w'. De modo análogo se verifica que A*(aw) = a • A*w. 
Assim, A* G C[ F; E). 

A transposta de uma matriz a = [aq] G M(m x n) é a matriz 
a T = [ujt] G M(u x m) que tem como linhas as colunas de a e como 
colunas as linhas de a, na mesma ordem. 

Teorema 11.2. Sejam U = {ui,..., u n ) c Fe V = {vi,..., v m } c F 
bases ortonormais. Se a = [cqj] G M(m x n) é a matriz da trans¬ 
formação linear A: F —> F nas bases U, V então a matriz da adjunta 
A*: F —> F nas bases V, U é a transposta a T = [a^] G M(u x m) 
de a. 


136 A Adjunta 


Seção 11 


Demonstração: Por definição de matriz de uma transformação li¬ 
near, temos 

m 

Auj = Y_ ctijVi (j = 1,..., n) 

i=1 

e 

n 

A*Vi = Y_ b ri u r, 

r=l 

onde b = [b T J e M(u x m) é a matriz de A* nas bases V, U, a ser 
determinada. Como ambas as bases são ortonormais, temos, para 
cada t = 1,..., m e cada j = 1,..., n: 

bji = (uj, A* Vi) = ( Au, , Vi) = dij 

portanto, b = a T , transposta de a. □ 

Corolário. Uma transformação linear A e sua adjunta A* têm o 
mesmo posto. (Vide Teorema 8.2.) 

É apresentada a seguir uma lista de propriedades operacionais 
da adjunta de uma transformação linear, as quais se traduzem em 
propriedades da transposta de uma matriz, via Teorema 11.2. A va¬ 
lidez dessas propriedades decorre da observação de que duas trans¬ 
formações lineares A, B: E —> F são iguais quando se tem (Au, v) = 
(Bu,v) para quaisquer u e E, v e F. 

P = I du) T = In 

(A + B)* = A* + B* (a + b) T = a T + b T 

(cxA)* = <xA* (aa) T = aa T 

(BA)* = A*B* (ba) T = a T b T 

A** = A (a T ) T = a 

Se A: F —> Fé uma transformação linear injetiva então existe 
B: F —> E tal que BA = Ie (vide Teorema 6.5). Tomando a adjunta 
de ambos os membros desta igualdade, temos A*B* = Ie. Assim 
A*: F —> F possui uma inversa à direita B*, logo é sobrejetiva. (Te¬ 
orema 6.1.) Do mesmo modo se vê que A sobrejetiva implica A* 
injetiva. Portanto a adjunta de um isomorfismo A: F —> F é um iso¬ 
morfismo A*: F —> F. Além disso, de A _1 A = Ie resulta A* (A -1 )* = Ie 
logo (A*)" 1 = (A” 1 )*. 
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Analogamente, uma matriz quadrada a é invertível se, e somente 
se, sua transposta a T é invertível e, no caso afirmativo, ( a 1 ) ~ 1 = 

(a- 1 ) 1 - 

As noções de retas e planos perpendiculares da Geometria Ele¬ 
mentar se estendem em Álgebra Linear ao conceito de complemento 
ortogonal, o qual ajuda a entender as relações entre uma transfor¬ 
mação linear e sua adjunta. 

Seja E um espaço vetorial com produto interno. O complemento 
ortogonal de um conjunto não-vazio X c E é o conjunto X 1 - formado 
pelos vetores v e E que são ortogonais a todos os vetores x e X. 
Portanto 

v6X i O(v,x)=0 para todo xgX. 

• Dado X c E, temos (0, x) = 0 para todo x e X, logo OeX 1 . 

• SevgX 1 ea6l então (av, x) = a (v, x) = 0 para todo x € X, 
portanto av e X 1 . 

• Se u € X- 1 e v € X- 1 então, para todo x € X, tem-se (u + v, x) = 
(u,x) + (v,x) = 0, logo utvgX 1 . 

Segue-se das três observações acima que o complemento ortogo¬ 
nal de qualquer conjunto não-vazio XcEé um subespaço vetorial 
de E. 

Evidentemente, XcY^>Y i cX i evgXnX 1 4v = 0. 

Além disso, se v é ortogonal aos vetores xi,..., x m então v é orto¬ 
gonal a qualquer combinação linear Icqxi, pois 

(v, y _ <*í*í) = X. ai ( v > = °- 

Daí resulta que o complemento ortogonal X 1 do conjunto X coincide 
com o complemento ortogonal S(X) 1 - do subespaço vetorial S(X), ge¬ 
rado por X. 

Exemplo 11.1. Tem-se {O}- 1 = E e E 1 = {0}. Se F c M n é o subespaço 
vetorial gerado pelo vetor não nulo v = (cq, ..., a n ) (reta que passa 
pela origem), o complemento ortogonal F 1 é o hiperplano definido 
pela equação cqxi + • • • + a n x n = 0. 

Teorema 11.3. Seja E um espaço vetorial de dimensão finita, mu¬ 
nido de produto interno. Para todo subespaço vetorial FcE tem-se a 
decomposição em soma direta E = E © FÁ 
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Demonstração: Seja {ui,...,u n } C E uma base ortonormal cujos 
primeiros m elementos ui,..., u m formam uma base (ortonormal) 
de F. (Começa-se com uma base qualquer de F, estende-se-a a uma 
base de F e depois aplica-se Gram-Schmidt.) Para todo vetor v € F 

tem-se v = oqui H-1- a n u n = z + w, onde z = oqui H-1- a m u m € F 

e w = a m+ iu m+ i + • • • + cx n u n G F- 1 . Portanto F = F + F- 1 . Como 
F n F 1 = {0}, segue-se que F = F © FV □ 

Corolário 1. dim F + dim F- 1 = dim F. 

Corolário 2. Para todo subespaço vetorial FcE, tem-se (F^)- 1 = F. 

Com efeito, seja qual for o conjunto não-vazio X c F, vale a in¬ 
clusão X c (X- 1 -)- 1 -. Em particular, o subespaço F está contido em 
(F^)- 1 . Do Corolário 1 resulta que 

dim^)- 1 = dim F — dim F -1 = dim F — (dim F — dim F) = dim F. 


Logo F = (F- 1 )- 1 . 


□ 


Vimos na Seção 10 que a projeção ortogonal de um vetor v € F 
sobre um subespaço F c E é, por definição, o vetor 



onde (wi,..., w m } c F é uma base ortogonal. Vimos ainda que, pondo 
w = v — z, temos v = z + w, com z G F e w perpendicular a todos os 
Wi (i = 1,..., m), logo w G F- 1 . Ficou no ar a questão de saber até 
que ponto o vetor z = pr F (v) depende da escolha da base ortogonal 
{w-| ,..., w m } c F. A resposta é dada pelo Teorema 11.3. Como F = 
F © F^, é única a maneira de escrever um vetor v G F como soma 
v = z + w de um vetor z G F com um vetor wGf 1 . Isto mostra que 
z = pr F (v) não depende da escolha dos w F . (Veja também o Exercí¬ 
cio 11.5.) 

De agora em diante, indicaremos com a notação P F : F —> F, ou 
simplesmente P: F —» F, quando não houver perigo de confusão, a 
projeção associada à decomposição F = F © F- 1 , a qual chamaremos a 
projeção ortogonal sobre F. 
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Teorema 11.4. Dada a transformação linear A: E—*F, entre espaços 
vetoriais de dimensão finita munidos de produto interno, tem-se 

U{A*) = Xm(A) ± , 

Xm(A*) =A^(A) ± , 

Af{A) = Xm(A*) ± e 
Xm(A) =M[A*) ± . 


Demonstração: Basta provar a primeira dessas igualdades; as de¬ 
mais se seguem dela usando A** = A e f- 11 - = F. Ora, 

v G J\f[A*) & A*v = 0 <=> (u, A*v) = 0 q.q.s. ueEO 
<f$ (Au, v) = 0 q.q.s. u G E <4 v G Xm(A) -1 . 


:p 

Corolário 1. A fim de que o sistema de m equações lineares com n 
incógnitas 

n 

^atjXj=b L (i = 1,..., m) 
j=i 

possua solução é necessário e suficiente que o vetor b = (tq ,..., b m ) G 
M m seja perpendicular a toda solução y = (yi,...,y m ) do sistema 
homogêneo transposto 

m 

Y _ Q jiyj = o (í = i,...,u). 

j=i 


Com efeito, pela última das igualdades do Teorema 11.4, o sis¬ 
tema Ax = b tem solução se, e somente se, b é ortogonal ao núcleo 
de A*, isto é, a todas as soluções y G do sistema homogêneo 
A*y =0. □ 

O ponto do Corolário 1 é que ele permite concluir a existência de 
soluções sem que seja necessário exibir uma delas. 

Corolário 2. O posto de A* é igual ao posto de A. 
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Com efeito, se dim E = n então dim J\í[A) + dim Xm(A) = n, logo 

dim Xm(A*) = n — dim Aí [A] 

= n — [n — dim Xm(A)] 

= dim Xm(A). 


□ 

Esta prova do Corolário 2 é uma alternativa para o corolário do 
Teorema 11.2 sem o uso de matrizes. 

Na Fig. 11.1, os pares de retas perpendiculares representam pa¬ 
res de subespaços, cada um dos quais é o complemento ortogonal do 
outro. 




Figura 11.1. 


Exercícios 

11.1. Seja A: E —> F uma transformação linear entre espaços veto¬ 
riais de dimensão finita, munidos de produto interno. Prove: 

(a) Se A é sobrejetiva então AA*: F —> E é invertível e 
A*(AA*) -1 : E —> E é uma inversa à direita de A. 

(b) Se A é injetiva então A*A: E —> E é invertível e (A*A) -1 A* é 
uma inversa à esquerda de A. 
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11.2. Use o exercício anterior a fim de achar uma inversa à direita 
para a transformação linear A: M 3 —> M 2 , dada por A(x,y,z) = (x + 
2y + 3z, 2x — y — z) e uma inversa à esquerda para a transformação 
linear B: M 2 —> R 4 , onde A(x,y) = (x + 2y,2x —y,x + 3y,4x + y). 


11.3. Dada a matriz a = 


contre uma matriz b e M(3 x 2) ta' 


, calcule aa T e, a partir daí, en- 
que ab = I 2 . 


11.4. Seja P: E —> E uma projeção num espaço vetorial de dimensão 
finita, munido de produto interno. Prove que P* também é uma 
projeção. Dê um exemplo em que P* / P. 

11.5. Seja U = {ui,...,u r } uma base ortonormal do subespaço F, 
contido no espaço vetorial E, dotado de produto interno. Usando U, 
defina a aplicação P: E —1 E, pondo, para todo v € E, Pv = pr u (v) = 

r 

Y_ (v,uí)uí. Prove que P é um operador linear com Im(P) = E, 

i=1 

jV(P) = F 1 e P 2 = P. Obtenha assim outra demonstração de que 
E = E © EU (Vide Teorema 7.2.) 

11.6. Considere, no espaço vetorial M(u x n), 0 produto interno 
definido por 

(a,b) = Y_ Q ij b ij) 

se a = [ay] e b = [by]. (Vide Exercício 11.17.) Mostre que 0 
subespaço A das matrizes anti-simétricas é 0 complemento ortogo¬ 
nal do subespaço S das matrizes simétricas em M(n x n). 

11.7. No espaço vetorial E das funções contínuas f: [—1,1] — > R, se¬ 
jam E, G c E os subespaços vetoriais formados pelas funções pares e 
pelas funções ímpares, respectivamente. Relativamente ao produto 
interno (f, g) = J_, f(x)g(x) dx, em E, mostre que G é o complemento 
ortogonal de E. 


11.8. Se os operadores lineares A, B: E —* E comutam (isto é, AB = 
BA), prove que A* e B* também comutam. 


11.9. Sejam {ui,..., u n } c E e {vi,..., v m } c E conjuntos de geradores 
nesses espaços vetoriais com produto interno. Sejam ainda A: E —» E 
eB:E-)E transformações lineares tais que (AuyVi) = (uj, Bv*) para 
i = 1,...,mej = 1,...,n. Prove que B = A*. 
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11.10. Dada a matriz a e M(m x n), prove que ou o sistema ax = b 
tem solução qualquer que seja b e M(mx 1) ou o sistema homogêneo 
transposto a T y = 0 admite uma solução não-trivial. 

11.11. No espaço M(n x u), munido do produto interno (a,b) = 
tr(a T b), (veja Exercício 11.17) considere uma matriz fixa a e defina 
o operador linear T a : M(nxn) —> M(nxn) pondo T a x = ax. Mostre 
que a adjunta de T a é Tb, onde b = a T . Prove um resultado análogo 
para o operador S a : M(n x n) —> M(n x n), onde S a x = xa. (Obs. 
tr(ab) = tr(ba).) 

11.12. Seja S: M 3 
lamente à reta x 
para a projeção P 
mesma reta. 

11.13. Sejam A, B: E —> E operadores lineares num espaço vetorial 
de dimensão finita, munido de produto interno. Prove que se B*A = 
0 então, para todo v € E, os vetores Av e Bv são perpendiculares. Em 
particular, se A* A = 0 então A = 0. 

11.14. Para todo conjunto não-vazio X num espaço vetorial munido 

de produto interno, prove que X 1 = S(X) (subespaço vetorial gerado 

por X). 

11.15. Sejam Fi, F 2 subespaços do espaço E, munido de produto in¬ 
terno. Prove que (Fi + F 2 )- 1 - = Ff n Ff, (Ei n F 2 ) 1 - = Ff + Ff. 

11.16. Dê mais uma demonstração de que A e A* têm 0 mesmo posto, 
nas seguintes linhas: a afirmação é verdadeira quando A:F —> F é 
injetiva ou sobrejetiva pois nestes casos A* é sobrejetiva ou injetiva, 
respectivamente. Para a conclusão no caso geral, use 0 fato de que 
toda transformação linear se escreve como um produto BA, onde B é 
injetiva e A é sobretiva. (Exercício 6.29.) 

11.17. Sejam F, F espaços vetoriais de dimensão finita, munidos de 
produto interno. Dadas as transformações lineares A, B: F —> F, po¬ 
nha (A, B) = tr(A*B) e prove que isto define um produto interno em 
£(F;F). (Vide Exercício 8.37.) Se a = [ay] e b = [b t j] são as matrizes 
de A e B em relação a bases ortonormais de F e F respectivamente, 
prove que (A, B) = Y_ a ijbíj- 

y 


—> M 3 a reflexão em torno do plano z = 0, parale- 
= y = z. Determine a adjunta S*. Mesma questão 
: M 3 —» M 3 , sobre 0 mesmo plano, paralelamente à 
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11.18. Prove que uma projeção P: E —> E, num espaço com produto 
interno, é ortogonal (isto é, jV(P) = ZmíP)- 1 ) se, e somente se, para 
todo veE tem-se (Pv,v — Pv) = 0. 

11.19. Use o exercício anterior para provar que se uma projeção 
P: E —> E cumpre |Pv| < |v| para todo v e E então P é ortogonal. 
[Sugestão: suponha que, para algum v € E, Pv não fosse ortogonal 
a v — Pv. Tome w = pé da perpendicular baixada de 0 sobre a reta 
que contém v e Pv. Então |w| < |Pv|. Mas todos os pontos desta reta 
têm a mesma imagem por P. Logo |Pv| = jPw| e daí |w| < |Pw|, uma 
contradição.] 

11.20. Ache uma base para o complemento ortogonal do subespaço 
(plano) de M 3 gerado pelos vetores u = (3, —1,2) e v = (—1,2,3). 

11.21. Dado o operador A: R 3 —> R 3 , definido por A(x,y,z) = 
(x + y + z, 3x — 2y — z, —2x + 3y + 2z), obtenha bases para os seguintes 
subespaços de R 3 : Zm(A), J\Í[A), 2m(A*) eJ\f[A*). 

11.22. Considere a base {u,v, w} c R 3 onde u = (1,1,1), v = (1,2,3), 
w = (1, —2,1). Determine as matrizes (na base canônica) dos funcio¬ 
nais lineares u*, v*, w*: R 3 —» R que formam a base dual de {u, v, w}. 

11.23. Com a notação do exercício anterior, a base {u,v,w} c R 3 
determina um isomorfismo i[>: (R 3 )* —> R 3 , que a cada funcional f € 
(R 3 )* faz corresponder sua matriz (do tipo 1 x 3) na base dada. Prove 

que i[>(f) = [<b b, c] <(=> f = au* + bv* + cw*. 

11.24. Demonstre que (AB)* = B*A* e A** = A. 

11.25. Estabeleça uma conexão entre os Exercícios 4.20 e 10.15 por 
intermédio do Teorema 11.1. 

11.26. Seja A: E —> F uma transformação linear entre espaços de 
dimensão finita, com produto interno. Se dim E < dim E, prove que 
o operador AA*: E —» E não é invertível mas se JV"(A) = {0} então 
A*A: E —> E é invertível. Dê um exemplo desta situação com E = R 2 
e E = R 3 . Que se pode afirmar quando dim E > dim E ? 

11.27. Num espaço vetorial E munido de produto interno, sejam 
V = {vi,...,v n } e W = {wi,...,w n } bases tais que (vt,Wj) = 5y. 
(Cfr. Exercício 10.15.) Prove que a matriz do operador linear A* 
na base W é a transposta da matriz do operador A na base V. 
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11.28. Seja a uma matriz quadrada. Se o traço (soma dos elementos 
da diagonal) de a T .a é zero, prove que a = 0. 

11.29. Uma matriz quadrada a chama-se diagonalizável quando é 
semelhante a uma matriz d = [dq] do tipo diagonal (dq = 0 se i / j), 
ou seja, quando existe p invertível tal que p 'ap = d. Prove que 
se a é diagonalizável então a T também o é. Se a matriz do operador 
A: E —> E relativamente a uma base de E é diagonalizável, prove que 
a matriz de A em relação a qualquer outra base é diagonalizável. 

11.30. Prove que a adjunta de A: E —> E, onde Av = (v, a) b, é A*v = 
(v, b) a. 

11.31. Seja f*: R —> E a adjunta do funcional linear f: E —> R. 
Prove que v = f* (1) é o vetor de E que corresponde a f pelo isomor¬ 
fismo do Teorema 11.1. Prove ainda que f(f*(l)) = |v| 2 e f*(f(w)) = 
(w, v)v Vw € E. 

11.32. Para toda transformação linear A: E —» E, entre espaços de 
dimensão finita munidos de produto interno, prove que a restrição 
de A à imagem de A* define um isomorfismo A: Xm(A*) —> 5rn(A). 
Analogamente, A* transforma o subespaço Zm(A) isomorficamente 
sobre 2m(A*). São estes isomorfismos um o inverso do outro? 

11.33. Seja {ui,..., u n } c E uma base ortonormal. Para todo opera¬ 
dor linear A: E —> E, prove que 

n n 

Y IAuíI 2 = Y_ |A*UiJ 2 . 

i—i i=l 

11.34. Seja J: E —> E a inclusão do subespaço E c E, isto é, Jv = v 
para todo v € F. Prove que J*J: F —» E é o operador identidade de 
E e que o operador JJ*: E —> E é a projeção de núcleo f 2 - e imagem 
E. (Noutras palavras, a adjunta J*: E —> E é esta mesma projeção, 
porém considerada com contra-domínio E.) 
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Quanto menor é a dimensão do espaço E, mais fácil é estudar os ope¬ 
radores lineares A: E —> E. (Isto é especialmente verdadeiro quando 
dim E = 1 ou dim E = 2.) Por isso, quando se tem um operador 
A: E —-> E, é natural que se tente, de alguma maneira, “decompô-lo” 
em operadores definidos em subespaços de dimensões menores. O 
passo inicial nessa busca é a noção de subespaço invariante por um 
operador, que estudaremos nesta seção. E o caso de maior êxito é o 
dos operadores auto-adjuntos; como veremos na seção seguinte, todo 
operador daquele tipo se decompõe em operadores uni-dimensionais. 
Outros exemplos de sucesso serão vistos nas Seções 14 e 15. As bases 
serão lançadas agora. 

Provaremos nesta seção (Teorema 12.1) que, dado um operador 
linear A: E —> E num espaço vetorial de dimensão finita, ou bem 
existe um vetor não-nulo u 6 E tal que Au = Àu ou então existem 
u,v € E linearmente independentes tais que Au e Av são ambos 
combinações lineares de u e v: Au = <xu + |3v, Av = yu + Sv. Este 
fato será fundamental para o estudo de certos tipos particularmente 
importantes de operadores, como os auto-adjuntos e os ortogonais, 
que abordaremos nas seções seguintes. 

Para demonstrar o Teorema 12.1, faremos uso do chamado Teo¬ 
rema Fundamental da Álgebra, do qual resulta que todo polinómio 
mônico real se decompõe como produto de polinómios mônicos irre- 
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dutíveis do primeiro e do segundo graus. (Lembramos que se chama 
mônico um polinómio no qual o coeficiente do termo de mais alto 
grau é igual ale que um polinómio irredutível do segundo grau não 
admite raiz real.) 

O teorema a ser demonstrado significa que existe em E um sub- 
espaço vetorial de dimensão 1 ou 2, invariante por A de acordo com 
a seguinte definição. 

Diz-se que um subespaço vetorial FcEé invariante pelo opera¬ 
dor linear A: E —> E quando A(F) C F, isto é, quando a imagem Av 
de qualquer vetor v € F é ainda um vetor em F. 

Se F é um subespaço invariante do operador A: E —» E, a restrição 
de A aos vetores de F define um operador que, salvo quando houver 
perigo de confusão, indicaremos com a mesma notação A: F —> F. 
Assim, a existência de um subespaço invariante permite o estudo de 
um operador mais simples, por estar definido num domínio menor. 

Exemplo 12.1. Os subespaços {0} e E são invariantes por qualquer 
operador A: E —i E. O núcleo N{A) e a imagem Zm(A) são também 
exemplos óbvios de subespaços invariantes. Um subespaço F de di¬ 
mensão 1 (reta passando pela origem) é invariante por A se, e so¬ 
mente se, existe um número À tal que Av = Av para todo veF. [Com 
efeito, fixando um vetor u / 0 em F, todos os demais elementos de 
F são da forma <xu, a € R. Como Au e F, tem-se Au = Àu. Para 
qualquer outro veF, vale v = cxu logo Av = aAu = aAu = Aau, logo 
Av = Av, com o mesmo A.] Se u,v e E são linearmente independen¬ 
tes, o subespaço F gerado por u e v (plano contendo a origem) é inva¬ 
riante por A se, e somente se Au € F e Av € F, isto é, Au = oai + |3v 
e Av = yu + óv. 

Um vetor v / 0 em E chama-se um autovetor do operador 
A: E —> E quando existe A 6 M tal que 


Av = Av. 


O número A e K, por sua vez, chama-se um autovalor do operador 
A quando existe um vetor não-nulo v € E tal que Av = Av. Diz-se 
então que o autovalor A corresponde, ou pertence, ao autovetor v e, 
vice-versa, que o autovetor v também corresponde, ou pertence, ao 
autovalor A. Então, para todo w = av, tem-se Aw = Aw. 
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Achar um autovetor (ou, o que é equivalente, um autovalor) do 
operador A é, portanto, o mesmo que achar um subespaço de di¬ 
mensão 1 invariante por A. 

Analogamente, diz-se que o número real À é um autovalor da 
matriz a 6 M(u x u) quando À é um autovalor do operador A: R n —> 
M n , cuja matriz na base canônica é a. Isto significa que existe um 
vetor x / 0 em M n tal que Ax = Ax ou, o que é, o mesmo, uma matriz 
não-nula xg M(nx 1) tal que ax = Ax. 

Exemplo 12.2. Uma rotação R: R 2 —> R 2 em torno da origem, de 
ângulo diferente de 0 o e 180°, não admite outros subespaços invari¬ 
antes além de {0} e R 2 . Por outro lado, para todo a e R, a rotação 
A: R 3 —> R 3 de ângulo <x em torno do eixo z, definida por 

A(x,y,z) = (xcos a — tj sen a, xsen a + y cos a, z), 

tem o eixo z e o plano z = 0 como subespaços invariantes. Para todo 
z / 0, o vetor v = (0,0, z) é um autovetor de A, cujo autovalor cor¬ 
respondente é 1, pois Av = v. Já no caso de uma reflexão S: E —> E em 
torno do subespaço Tq, paralelamente a F 2 (vide Teorema 7.3), todo 
vetor não-nulo em 1] é um autovetor de S, com autovalor 1, enquanto 
que os vetores não-nulos em E 2 são autovetores correspondentes ao 
autovalor —1. Finalmente, se 0 operador A tem núcleo não-trivial 
então todo vetor não-nulo v € A7(A) é um autovetor pois Av = 0 • v. 

Exemplo 12.3. O operador A: R 2 —> R 2 , definido por A(x,y) = 
(x + cqjjy), chama-se cisalhamento. Se a / 0, os únicos subespaços 
invariantes por A são {0}, l 2 eo eixo das abcissas. Com efeito, qual¬ 
quer outro subespaço de R 2 é uma reta F, formada pelos múltiplos 
tv = (ta, tb) de um vetor v = (a, b), com b / 0. Se t / 0 tem-se tv e E 
mas A(tv) = (ta + atb, tb) = tv + (cxtb, 0) ^ E logo F não é invariante 
por A. 

Dados 0 polinómio p(x) = ao + aix + ••• + a n x n e 0 operador 
A: E —> E, a notação p(A) indica 0 operador 

p(A) = a 0 I + ai A 4-F a n A n . 

Lema. Para todo operador linear A: E —> E, num espaço vetorial de 
dimensão finita, existem um polinómio mônico irredutível p, de grau 
1 ou 2, e um vetor não-nulo v e E, tais que p(A) • v = 0. 
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Demonstração: Seja n = dim E. Como dim £(E) = n 2 , os 
n l + 1 operadores I, A,, A n " são linearmente dependentes. Por¬ 
tanto existem números reais <x 0 ,..., ct^i, não todos nulos, tais que 

2 

a 0 I + ai A -I-1- «h 2 A n " = 0. Seja oc m o coeficiente não-nulo de maior 

índice nesta expressão. Dividindo-a por a m , obtemos um polinómio 
mônico p(x) = |3 0 + |3]X + • • • + |3 m _ix m_1 + x m tal que p(A) = 0. 
Sabemos que existe uma fatoração p(x) = pi (x) • P 2 W • • • pk(x), onde 
cada pi é um polinómio mônico irredutível de grau 1 ou 2. Temos 
pi (A) • p 2 (A) • • -pic(A) = 0. Logo, pelo menos um dos operadores 
Pt (A) não é invertível. Assim, existe um vetor não-nulo v e E tal que 
Pi(A) • v = 0. □ 

Teorema 12.1. Todo operador linear num espaço vetorial de di¬ 
mensão finita possui um subespaço invariante de dimensão 1 ou 2. 

Demonstração: Dado A: E —> E, sejam p o polinómio eveEo vetor 
não-nulo dados pelo lema, com p(A) • v = 0. Se p(x) = x — À então 
Av — Àv = 0, donde Av = Av, logo a reta que passa pela origem e 
contém v é um subespaço invariante por A, de dimensão 1. Se p tem 
grau 2, p(x) = x 2 + ax + b, então A 2 v + aAv + bv = p(A) • v = 0, logo 
A(Av) = —aAv — bv. Isto mostra que o subespaço gerado por v e Av 
é invariante por A. Além disso, v e Av são L.I. pois se tivéssemos 
Av = Àv então 

0 = A 2 v + aAv + bv = À 2 v + aAv + bv = (À 2 + aÀ + b)v, 

donde À 2 + aÀ + b = 0, uma contradição pois p(x) = x 2 + ax + b não 
tem raiz real. Logo o subespaço invariante gerado por v e Av tem 
dimensão 2. □ 

Um operador linear num espaço vetorial de dimensão n admite 
no máximo n autovalores distintos. Isto é consequência do 

Teorema 12.2. A autovalores diferentes do mesmo operador corres¬ 
pondem autovetores linearmente independentes. 

Demonstração: Dado o operador linear A: E —> E, sejam vi,... ,v m 
vetores não-nulos em E tais que Avq = Àivi, ..., Av m = À m v m , onde 
os números reais Ài,..., À m são dois a dois diferentes. Provaremos, 
por indução, que esses vetores são L.I.. A afirmação é óbvia quando 
m = 1. Supondo-a verdadeira para m — 1 vetores, inferiremos daí 
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sua validez para m. Dada a combinação linear nula 

ociVi H-h <x m v m = 0, (*) 

aplicamos o operador A a ambos os membros desta igualdade, le¬ 
vando em conta que Avt = À^vi. Resulta então que 

Ai oqv! 4-f À m a m v m = 0. (**) 

Multiplicando a igualdade (*) por A m e subtraindo de (**) vem: 

(Ài A m )cv|Vi + • • • + (A m _i A m ) oc m _i v m _i = 0. 

Pela hipótese de indução, os vetores vi,..., v m _i são L.I.. Logo 

(Ai A m )<xi = • • • = (A m _i A m )ix m _i = 0. 

Como os autovalores são todos diferentes, as m — 1 diferenças nos 
parênteses acima são / 0, logo oq = • • • = a m ^i = 0. Isto reduz 
a igualdade (*) a oc m v m = 0. Como v m / 0, segue-se que <x m = 0. 
Assim, a igualdade (*) só pode ocorrer quando todos os coeficientes 
oíí são nulos, o que prova o teorema. □ 

Corolário. Seja dim E = n. Se um operador linear A: E —> E possui 
n autovalores diferentes então existe uma base {vi,..., v n } c E em 
relação à qual a matriz de A é diagonal (isto é, tem a forma [aq] com 
aq = 0 se i / jj. 

Com efeito, se Avi = Aivi,..., Av n = A n v n com os vt não-nulos e 
os Ai dois a dois distintos então {vi,..., v n } é, em virtude do Teorema 
12.2, uma base de E. A matriz de A nesta base é 

Ai 

A 2 


na qual os termos que não aparecem são iguais a zero. □ 

A igualdade Av = Av equivale a (A — AI)v = 0, logo v é um 
autovetor do operador A: E —> E se, e somente se, é um elemento 
não-nulo do núcleo ÁÍ(A — AI). Noutras palavras, a fim de que A 
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seja um autovalor de A é necessário e suficiente que o operador 
A — ÀI: E —> E não possua inverso. 

Exemplo 12.4. Um caso particular importante ocorre quando 
dim E = 2. Vimos no Exemplo 2.6 que se {u,v} c E é uma base 
então os vetores au+(3veyu + 6v são linearmente dependentes se, 
e somente se, ocõ — (3y = 0. Dados o operador A: E —> E e a base 
{u, v) C E, sejam Au = au + cv e Av = bu + dv. Noutras palavras, a 
matriz do operador A na base {u, v} é 

a b 

c d 


Então (A —ÀI)u = (a —A)u + cv e (A —ÀI)v = bu+ (d — À)v. Afim de 
que A —AI não seja invertível é necessário e suficiente que os vetores 
(A —AI)u e (A —AI)v sejam L.D., ou seja, que (a —A)(d —A) — bc = 0, 
ou ainda, que A seja raiz do polinómio 

p(A) = A 2 — (a + d)A + ad — bc, 


chamado o polinómio característico do operador A. 

Portanto, o número real A é um autovalor do operador A: E —> E, 
onde dim E = 2, se, e somente se, é uma raiz do polinómio carac¬ 
terístico do operador A, o qual, por definição, é p(A) = A 2 — (a + d)A + 
ad—bc. Os coeficientes de p(A) são tirados da matriz de A em relação 
a uma base qualquer de E. 


Observação. A matriz do operador A muda quando se passa de 
uma base para outra. Mas o polinómio p(A) (isto é, as expressões 
a + d e ad — bc, que são seus coeficientes) permanece (isto é, perma¬ 
necem) sem alteração. Isto será provado na Seção 20. No presente 
caso (dim E = 2), é claro que a + d = traço de A, logo independe da 
base escolhida. Quanto ao coeficiente ad — bc (o determinante da 

matriz a = Q ^ ), vide o Exercício 12.7. 


Exemplo 12.5. No caso da rotação R: M 2 — > M 2 , R(x,y) = (xcos 0 — 
y sen 0,xsen 0 + y cos 0), temos a = cos 0, b = — sen 0, c = sen 0, 
d = cos 0, logo o polinómio característico de R é 

p(A) = A 2 — (2cos 0)A + 1. 
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Se 0 7 ^ 0 e 0 / 180°, o trinômio p(À) não possui raiz real pois neste 
caso seu discriminante A = 4(cos 2 0 — 1) é negativo. Conseqüente- 
mente R só possui autovalores (reais) se 0 = 0 ou 0 = 180°. 

Exemplo 12.6. Definamos o operador A: R 2 — » M 2 pondo A(x,y) = 
(4x + 3y, x + 2y ). Seu polinómio característico é p(A) = À 2 — 6A + 5, 
cujas raízes são Ài = 1 e À 2 = 5. Estes números são autovalores de A. 
Existem, portanto, vetores não-nulos vi e vz em M 2 , tais que Avi = vi 
e Av 2 = 5v 2. Pelo Teorema 12.2, vi e V 2 formam uma base de M 2 , em 
relação à qual a matriz do operador A tem a forma diagonal: 

'1 0' 

a ~~ [o 5 

A fim de determinar os vetores vi = (x,y) e V 2 = (r, s) exprimimos as 
igualdades Avi = vi e Av 2 = 5v2 em termos de coordenadas, obtendo 
os sistemas lineares 


4x + 3y = x 
* + 2 V = V 


e 


4r + 3s = 5r 
r + 2s = 5s. 

Ambos os sistemas acima são indeterminados, e tinham que ser 
assim pois se v é autovetor de A, todo múltiplo av também é. To¬ 
mando uma solução não-nula de cada um desses sistemas obtemos 
vi = (1, — 1), V 2 = (3,1) tais que {vi, V 2 } cK 2 é uma base formada por 
autovetores de A. 


Exercícios 

12.1. Suponha que 0 operador linear A: E —> E, num espaço vetorial 
de dimensão n, admita um subespaço invariante E, de dimensão r. 
Prove que existe uma base de E, relativamente à qual a matriz de A 
tem a forma 

a b 
0 c ’ 
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com a E M(r x r), b E M(r x (n — r)), 0 E M((n — r) x r) e c E 
M((n — r) x (u — r)). 

12.2. Enuncie e prove um resultado análogo ao do exercício anterior, 
supondo que E = F © G, onde F e G são invariantes pelo operador A. 

12.3. Dê exemplo de um operador linear A:K 3 -^! 3 que admite um 
subespaço invariante FcK 3 com a seguinte propriedade: nenhum 
subespaço Gd 3 tal que M 3 = F © G é invariante por A. 

12.4. Dado o vetor não-nulo a E M 3 , determine os subespaços de 
M 3 invariantes pelo operador A: M 3 —> M 3 , definido por Av = a x v 
(produto vetorial: veja Exercício 10.27). 

12.5. Sejam A,B: F —> F operadores lineares. Se AB = BA, prove 
que A7(B) e Im(B) são subespaços invariantes por A. 

12.6. Dado o operador linear A: F —» F e o polinómio p(x), prove 
que os subespaços vetoriais jV(p(A)) e Im(p(A)) são invariantes 
por A. 

12.7. Um operador A: F —> F chama-se normal quando AA* = A*A. 
Prove que se A é normal então, para todo v E F, tem-se |Av| = |A*v| 
e conclua daí que todo auto-vetor de A é também auto-vetor de A*, 
com o mesmo auto-valor. (Sugestão: se A é normal, A—AI também é.) 

12.8. Se o operador A é normal, prove que Af(A)- 1 = Im(A). 

12.9. Seja P: R 3 —» R 3 uma projeção de posto 2. Prove que os únicos 
subespaços de M 3 invariantes por P estão contidos na imagem ou 
contêm o núcleo de P. E se o posto de P for igual a 1 ? 

12.10. Mostre que os subespaços vetoriais de C°°(M, M) gerados por 
cada um dos conjuntos abaixo são invariantes pelo operador de de¬ 
rivação D: C°°(M,M) —> C°°(M,M). 

(a) {cos x, sen x}; 

(b) {e x ,xe x ,x 2 e x }. 

12.11. Se F c K 3 é um subespaço de dimensão 2, invariante pelo 
operador linear A: M 3 —> M 3 , e A não possui auto-vetores em F, 
prove que nenhum subespaço de dimensão 2, além de F, é invariante 
por A. 

12.12. Dado o operador linear A: F —» F num espaço vetorial de 
dimensão 3, prove que existe uma base de E relativamente à qual a 
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matriz de A tem uma das formas abaixo: 


a 

b 

0 ' 


a 

b 

e 

c 

d 

0 

ou 

c 

d 

f 

e 

f 

9. 


_0 

0 

9. 


Em qualquer caso, prove que existe um vetor não-nulo v g E tal que 
Av = gv. [Observação: veremos na Seção 20 que, mais geralmente, 
todo operador linear num espaço vetorial de dimensão ímpar possui 
pelo menos um auto-vetor.] 

12.13. Se Fi,F 2 C E são subespaços invariantes pelo operador linear 
A: E — > E, prove que Fi n E2 e Fi + E2 também são invariantes por A. 

12.14. Seja A: E —> E um operador invertível, com dimE finita. Se 
0 subespaço F c E é invariante por A, prove que a restrição de A a 
F é ainda um operador invertível F -> F e conclua que F é também 
invariante por A -1 . 

12.15. Quais são os autovetores e autovalores do operador de deri¬ 
vação D: V —) V ? 

12.16. Num espaço vetorial E de dimensão n, prove que todo ope¬ 
rador linear possui um subespaço invariante de dimensão n — 1 ou 
n—2. (Sugestão: aplique 0 Teorema 12.1 à adjunta do operador dado, 
tendo antes introduzido um produto interno em E.) 


12.17. Se v e w são respectivamente autovetores de A e A*, corres¬ 
pondentes a autovalores A / p, prove que (v,w) = 0. 


12.18. Prove que um operador A é invertível se, e somente se, não 
tem autovalor igual a 0. No caso afirmativo, prove que os autoveto¬ 
res de A e de A -1 coincidem. E os autovalores? 


12.19. O determinante da matriz a = 


é, por definição, o 
ireto, mostre que se 
então det(am) = det a • det m. Prove ainda que det a / 


número det a = ad — bc. Mediante um cá 

v q 

m — 


a b 
c d 
culo c 


0 se, e somente se, a é invertível. Conclua que, para toda matriz 
invertível m, tem-se det a = det(m _1 am), logo todas as matrizes do 
operador A: E —> E, com d im E = 2, têm o mesmo determinante, o 
qual é chamado o determinante do operador A. 
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12.20. Dado o operador linear A: E —> E, suponha que E = Fi © F 2 , 
onde Avi = Àivi se vi € Fi e AV 2 = À 2 V 2 se vi € F 2 , com Ai / À 2 . Prove 
que Ai e A 2 são os únicos autovalores de A e que os autovetores de A 
estão em Fi ou em F 2 . 

12.21. Seja A: M n —> M n 0 operador linear cuja matriz na base 
canônica tem todos os elementos iguais a 1. Prove que 0 posto de 
A é igual ale que M n = Aí [A] © Zm(A). Conclua que os autovalores 
de A são 0 e n e que seus autovetores pertencem a Aí {A) ou a Zm(A). 
Exiba uma base de M n na qual a matriz de A tem u 2 — 1 zeros. 

12.22. Se todo vetor não-nulo de E for um autovetor do operador 
linear A: E —> E, prove que A = AI. 

12.23. Para todo autovalor A do operador linear A: E —> E, seja 
Ej = {v £ E;Av = Av}. Prove que E A é um subespaço vetorial de E, 
invariante por A. (E A chama-se auto-subespaço correspondente ao 
autovalor A.) 

12.24. Prove que um subespaço que contém 0 núcleo de uma proje¬ 
ção é invariante por essa projeção. 

12.25. Se AB = BA, prove que a imagem por B de um subespaço 
invariante por A é ainda invariante por A. 

12.26. Seja A: E —> E um operador linear tal que A 2 possui algum 
autovalor > 0. Prove que A possui autovetor. Dê um exemplo em 
que A 2 possui autovetor mas A não possui. 

12.27. Se os autovetores do operador linear A: E —* E geram 0 espaço 
E e, além disso, os subespaços invariantes por A são também invari¬ 
antes por B, prove que AB = BA. 

12.28. Seja dim E = n. Se 0 operador linear A: E —> E possui n 
autovalores distintos, prove que existem no espaço E exatamente 2 n 
subespaços invariantes por A. 

12.29. Seja A: E —> E um operador no espaço vetorial E, de dimensão 
finita, onde E = Fi © ■ • • © F^ e cada Fj. é invariante por A. Tome uma 
base V C E que seja uma união de bases dos F*. Determine a forma 
da matriz de A na base V. 
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12.30. Seja A: R 2 —> R 2 o operador definido por A(x,y) = (y,0). 

Quais são os autovalores de A? E os autovetores? Se a = , 

existe alguma matriz invertível p G M(2 x 2) tal que p 1 ap seja uma 
matriz diagonal? 

12.31. Seja A: R 2 —> R 2 o operador definido por A(x,y) = (2x — 
y, x + 4y). Mostre que A possui um autovalor único igual a 3 e que o 
auto-subespaço E 3 (v. Exercício 12.23) tem dimensão 1. Conclua que 
se 

'2 - 1 ' 
a “ [l 4 

então não existe uma matriz invertível b G M(2 x 2) tal que b ] ab 
seja diagonal. 

12.32. Seja A: R 2 —> R 2 o operador definido por A(x,y) = (3x + 
y, 2x+2y). Mostre que A possui os autovalores 4 e 1. Ache uma base 
{u,v} C R 2 tal que Au = 4u e Av = v. Dada a matriz 

_ ’ 3 1_ 
a “ [2 2 J ’ 

ache uma matriz invertível p € M(2 x 2) tal que p 'ap = 

12.33. Prove que todo operador linear de posto 1 em R n possui um 
autovetor cujo autovalor correspondente é 0 traço do operador dado. 

12.34. Seja p um polinómio / 0 cujas raízes são todas reais. Se 
p(A) = 0, prove que pelo menos uma raiz de p é autovalor do opera¬ 
dor A. 

12.35. Se 0 espaço vetorial E possui uma base formada por autove¬ 
tores do operador A: E —> E, prove que existe também uma base de 
E formada por autovetores de A*: E —> E. (Veja Exercício 11.29.) 

12.36. Sejam A: E —> E um operador linear num espaço de dimensão 
finita, munido de produto interno e E c E um subespaço invariante 
por A. Defina 0 operador B: E —» E pondo Bv = Av. Mostre que, para 
todo v G E, se tem A*v = B*v + Cv, com Cv G E 1 . 


4 0 
0 1 
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Operadores Auto-Adjuntos 


O Teorema Espectral para operadores auto-adjuntos, a ser provado 
nesta seção, é um dos resultados mais relevantes da Álgebra Linear. 
Serão também demonstradas algumas de suas conseqüências, entre 
as quais se destaca o Teorema dos Valores Singulares. 

Um operador linear A: E —> E, num espaço vetorial munido de 
produto interno, chama-se auto-adjunto quando A = A*, ou seja, 
quando (Au,v) = (u, Av) para quaisquer u,v e E. 

Se A, B: E —> E são operadores auto-adjuntos e <x € M então 

(A + B)* = A* + B* = A + B e (<xA)* = ocA* = ocA, logo A + B e 
ocA são auto-adjuntos. 

O produto AB dos operadores auto-adjuntos A, B é auto-adjunto 
se, e somente se, A e B comutam, isto é, AB = BA. Com efeito, sendo 
A e B auto-adjuntos, temos 

(AB)* = B*A* = BA. 

Logo, AB é auto-adjunto se, e somente se, BA = AB. 

Exemplo 13.1. Sejam A, B: M 2 — > M 2 os operadores lineares defi¬ 
nidos por A(x,y) = (x,2y) e B(x,y) = (y,x). Para todo v = (x,y) 
tem-se: 


(ei , A*v) = (Ae!, v) = (d, v) = x 
(e 2 , A*v) = (Ae 2 ,v) = (2e 2 ,v) = 2y, 
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portanto A*v = (x,2y) = Av e A* = A. Analogamente se mostra 
que B* = B. Entretanto, como AB(x,y) = (y,2x), vê-se que, para 
v = (x,y), (ei, (AB)*v) = (ABeyv) = 2y, enquanto (e 1? ABv) = y, logo 
(AB)* / AB, ou seja, o produto AB dos operadores auto-adjuntos 
A, B não é auto-adjunto. Isto se dá porque AB / BA. Com efeito, 
AB(x,y] = (y,2x) e BA(x,y) = (2y,x). 

Exemplo 13.2. A projeção ortogonal P: E —> E sobre um subespaço 
F c Eé um operador auto-adjunto. Com efeito, dados v = z + w, 
v' = z' + w', com z, z' € F e w, W € F 2 -, temos 

<Pv,v') = <z,v') = (z,z') = (v,z') = (v, Pv'). 

Reciprocamente, se a projeção P: E —> F sobre o subespaço Fi, para¬ 
lelamente a F 2 , onde E = Fi ® F 2 , for um operador auto-adjunto então 
para quaisquer vi € Fi, v 2 € F 2 vale 

(vi,V 2 ) = (Pvi,v 2 ) = (V!,Pv 2 ) = (vi,0) =0, 

logo F 2 = Ff. Assim, a projeção P: F —> F é um operador auto-adjunto 
se, e somente se, é uma projeção ortogonal. 

Uma matriz quadrada a = [ay] diz-se simétrica quando é igual à 
sua transposta a T , isto é, quando ay = ay para todo i e todo j. 

No teorema 13.1 é dado um operador linear A: F —> F, num 
espaço vetorial de dimensão finita, dotado de produto interno. 

Teorema 13.1. A: F —* F é auto-adjunto se, e somente se, sua matriz 
a = [ay] relativamente a uma (e portanto a qualquer) base ortonor- 
mal U = {ui,..., u n } cFé uma matriz simétrica. 

Demonstração: (uy Auj) = [i-ésima coordenada do vetor Au, na 
base U\ = [i-ésimo elemento da j-ésima coluna de a] = ay. Portanto 
a matriz a é simétrica se, e somente se, (uyAuj) = (AuyUj) para 
quaisquer i, j = 1,..., n. Devido à linearidade de A e à bilinearidade 
do produto interno, isto equivale a dizer que (u, Av) = (Au, v) para 
quaisquer u,v e F, ou seja, que A é auto-adjunto. □ 

Exemplo 13.3. As matrizes dos operadores A e B do Exemplo 13.1 
na base canônica de M 2 são respectivamente 
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ambas simétricas. Quanto ao Exemplo 13.2, se tomarmos em E uma 
base ortonormal cujos primeiros m elementos formem uma base de 
E e os últimos uma base de F 2 -, a matriz da projeção P nesta base 
terá os m primeiros termos da diagonal iguais a 1 e todos os demais 
elementos iguais a zero. Seu formato será 

'1 

1 


1 


0 


0 


onde os termos fora da diagonal, não indicados acima, são todos ze¬ 
ros. Essas matrizes são simétricas, refletindo o fato de que represen¬ 
tam operadores auto-adjuntos em bases ortonormais. Já o operador 
A no Exemplo 12.6 não é auto-adjunto pois na base canônica de M 2 


sua matriz é 


Teorema 13.2 Seja A: E —> E um operador auto-adjunto. Se o su- 
bespaço E c E é invariante por A, seu complemento ortogonal E 2 - 
também é. 


O Teorema 13.2 decorre imediatamente do 


Teorema 13.3 Se o subespaço E c E é invariante pelo operador li¬ 
near A: E —> E então seu complemento ortogonal E 2 - é invariante pelo 
operador adjunto A* : E —> E. 

Demonstração: [u £ E,v e F 2 -] => Au e E => (u, A*v) = (Au,v) = 
0 => A*v € E 2 -, logo E 2 - é invariante por A*. □ 

Exemplo 13.4. No cisalhamento A: M 2 —> M 2 , onde A(x,y) = 
(x + ocy,y), com a / 0, o eixo x, das abcissas, é invariante mas 
seu complemento ortogonal, o eixo y, das ordenadas, não é pois 
Ae 2 = (a, 1) não é vertical. 

No caso de um operador auto-adjunto, o Teorema 12.2 assume a 
forma mais precisa seguinte. 
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Teorema 13.4. Se Ài,..., A m são autovalores dois a dois diferentes 
do operador auto-adjunto A: E —> E, os autovetores correspondentes 
vi,...,v m são dois a dois ortogonais. 

Demonstração: Para i / j quaisquer: 

(Ai-Aj) (vi,Vj) = (AiVi,Vj) - (vi,AjVj) = (Av^Vj) - (v^Avj) 

= (Avi,Vj) — (Avi,Vj) = 0 pois A é auto-adjunto. 

Como Ai — Aj / 0, de (At — Aj) (ví,vj) = 0 resulta (ví,vj) = 0. J3 

Observação. Se Av = Av então, para todo múltiplo w = av, tem- 
se ainda Aw = Aw. Logo, na situação do Teorema 13.4, os vetores 
vi,..., v m podem ser tomados unitários, caso haja conveniência. 

Um problema importante sobre operadores num espaço vetorial 
de dimensão finita é o de encontrar uma base em relação à qual 
a matriz desse operador seja a mais simples possível. Mostrare¬ 
mos nesta seção que, se A: E —> E é um operador auto-adjunto num 
espaço vetorial de dimensão finita com produto interno, existe uma 
base ortonormal em E, relativamente à qual a matriz de A é uma 
matriz diagonal a = [aq], isto é atj = 0 se i / j. Este é o conteúdo do 
Teorema Espectral. 

Existe um tipo de operador auto-adjunto para o qual o Teorema 
Espectral é imediato: se P: E —> E é a projeção ortogonal sobre o 
subespaço F, tomando uma base ortonormal {ui,..., u n } c E cujos 
primeiros vetores U],..., u m formem uma base de F (portanto os 
n — m últimos formam uma base de E^), a matriz de P nesta base 
tem a forma diagonal vista no Exemplo 13.3. 

Quando se diz que a matriz do operador A: E —> E na base 
(ui,..., u n } c E é uma matriz diagonal, isto significa que, para todo 
j = 1,..., u, tem-se Auj = AjUj, ou seja, que os vetores da base dada 
são todos eles autovetores de A. 

No caso da projeção ortogonal sobre o subespaço E, tem-se 
Puj = Uj para j = 1,..., m e Puj = 0 se j = m + 1,..., n. Assim, 
a base ortonormal acima fixada é de fato formada por autovetores 
de P. Os autovalores são 1 e 0. 

Começamos com o caso particular do Teorema Espectral em que 
espaço tem dimensão 2. 
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Teorema 13.5. Seja A: E —> E um operador auto-adjunto num 
espaço vetorial de dimensão 2, munido de produto interno. Existe 
uma base ortonormal {ui, 1 x 2 } C E formada por autovetores de A. 

Demonstração: Seja {v,w} c E uma base ortonormal arbitrária. 
Em virtude do Teorema 13.1, temos Av = av + bw, Aw = bv + 
cw. Como vimos antes no Exemplo 12.4, os autovalores de A são 
as raízes reais do polinómio característico p(À) = A 2 — (a + c)A + ac — 
b 2 . O discriminante deste trinômio é A = (a + c) 2 — 4(ac — b 2 ) = 
(a — c) 2 + 4b 2 >0. Se A = 0 então b = 0, a = c e A = ai, logo todo 
vetor não-nulo em E é um autovetor. Se A > 0 então 0 trinômio p(À) 
possui 2 raízes reais distintas Ai,A 2 . Isto, como sabemos, quer dizer 
que os operadores A — AileA — A 2 I são ambos não invertíveis, logo 
existem vetores não-nulos (que podemos supor unitários) U],u 2 € E 
tais que (A — Ail)ui = 0 e (A — A 2 I)u 2 = 0, ou seja, Aui = Aiui e 
Au 2 = A 2 u 2 . Pelo Teorema 13.4, {ui,u 2 } c E é uma base ortonormal 
de autovetores de A. □ 

Corolário. Todo operador auto-adjunto A : E — > E, num espaço veto¬ 
rial de dimensão finita com produto interno, possui um autovetor. 

Com efeito, pelo Teorema 12.1 existe um subespaço E c E, de 
dimensão 1 ou 2, invariante por A. Se dimf = 1 todo vetor não-nulo 
v € E é um autovetor de A. Se dim F = 2 então, aplicando 0 Teorema 
13.5 à restrição A: F —> F de A ao subespaço invariante E, obtemos 
um autovetor v e E. □ 

Teorema 13.6. (Teorema Espectral.) Para todo operador auto- 
adjunto A: E —> E, num espaço vetorial de dimensão finita munido 
de produto interno, existe uma base ortonormal {ui,..., u n } c E for¬ 
mada por autovetores de A. 

Demonstração: Usaremos indução na dimensão de E. O teorema é 
evidente se dim E = 1. Supondo-o verdadeiro em dimensão n — 1, 
seja dim E = n. Pelo Corolário do Teorema 13.5, existe um au¬ 
tovetor unitário u n , portanto um subespaço F c E, de dimensão 
1, invariante por A. Pelo Teorema 13.2, 0 complemento ortogonal 
f- 1 também é invariante por A. Como dim F 2 - = n — 1, a hi¬ 
pótese de indução assegura a existência de uma base ortonormal 
{u 1 ,...,u n _|} C F x formada por autovetores da restrição A: F 2 - —> 
F 2 -. Segue-se que (ui, ... ,u n _i,u n } c E é uma base ortonormal for¬ 
mada por autovetores de A. □ 
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Observação. Vale a recíproca do Teorema Espectral: se existe uma 
base ortonormal {ui,..., u n } c E formada por autovetores do opera¬ 
dor A: E —> E então este operador é auto-adjunto. Com efeito, para 
quaisquer i, j = 1 ,..., u, tem-se 

(Aiq, Uj) = (ÀiUi, Uj) = Ai5ij = Ajõij = (ut, AjUj) = (uqAuj) 

e daí resulta que (Au, v) = (u, Av) para quaisquer u, v e E. 

Diremos que o operador linear A: E —> E é não-negativo, e escre¬ 
veremos A > 0, quando A for auto-adjunto e, além disso, (Av, v) > 0 
para todo v € E. No caso particular em que (Av,v) > 0 para todo 
v / 0, diremos que A é um operador positivo e escreveremos A > 0. 

Teorema 13.7. Um operador auto-adjunto A: E —> E é não-negativo 
se, e somente se, seus autovalores são todos >0. A é positivo se, e 
somente se, todos os seus autovalores são números positivos. 

Demonstração: Se A > 0 e Av = Av com v / 0 então 

A(v,v) = (Av,v) = (Av,v) > 0, 

portanto A > 0. Reciprocamente, se os autovalores de A são > 0, 
seja {ui,..., u n } c E uma base ortonormal formada por autovetores 
(a qual existe pelo Teorema Espectral), com Auí = Atut. Para todo 
vetor v € E, tem-se v = oqui + • • • + a n u n , logo 

(Av,v) = (ZoqAui, LocjUj) = (lajAtUj., IcxjUj) = lAiaf. 

Como At > 0 para í = 1,..., u, segue-se que (Av, v) > 0, portanto 
A > 0. A afirmação sobre operadores positivos se prova da mesma 
maneira. □ 

Corolário 1. Seja A > 0. Se, para um certo veE, vale (Av,v) = 0 
então Av = 0. 

Com efeito, sejam A],..., A k os autovalores não-nulos de A. Então, 

pondo v = <xi ui -t-1- tx n Un, resulta que Av = Ai ai ui + • • • + A^aicU^, 

donde 

0 = (Av, v) = Ai af -I-1- A k a^. 


Como A] > 0,..., A k > 0, segue-se que oq 
Av = 0. 


aic = 0, portanto 

□ 
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Observação. Geometricamente, A > 0 significa que o ângulo entre 
v e Av (caso estes vetores sejam / 0) é sempre agudo ou reto. O 
Corolário 1 diz que, quando Av / 0, esse ângulo é sempre agudo. 

Corolário 2. Um operador é positivo se, e somente se, é não-negativo 
e invertível. 

Com efeito, se A > 0 é invertível então, para todo v / 0 tem-se 
Av / 0 logo, pelo Corolário 1, (Av, v) > 0. A recíproca é óbvia. □ 

Uma matriz quadrada a = [aq] € M(n x n) diz-se não-negativa, 
e escreve-se a > 0, quando o operador A: M n —> M n , cuja matriz na 
base canônica é a, é não-negativo. 

Dado v = (xi,... , x n ) € M n , tem-se Av = (yi,... ,y n ) onde, para 
cada i = 1,..., n, -yi = ciiixi + 012 x 2 H-1- Qi n x n . Logo 

n n 

(Av, v) = ^XíPí = Y_ «AjXiXj . 

i=l i,j=l 

Portanto a matriz a = [aq] G M(n x u) é não-negativa se, e somente 
se, é simétrica e, para todo v = (xi,..., x n ) G M n tem-se 

n 

Y aqxixj > 0. 

y=i 

Analogamente, a matriz a diz-se positiva quando o operador 
A: M n —> R n , que a ela corresponde, é positivo. Isto significa que 
a é simétrica e, para todo v = (xi,..., x n ) / 0 em M n , tem-se 


n 

Y_ ciijXiXj > 0. 

y=i 


Assim uma matriz simétrica é não-negativa (respect. positiva) 
se, e somente se, seus autovalores são > 0 (respect. positivos). 

Exemplo 13.5. O polinómio característico da matriz simétrica 

CL b 9 ? a 

a = , é p(À) = À z — (a + c)À + ac — b z . A soma de suas raízes é 
b cj 

a+c e o produto é ac—b 2 . As raízes de p(À) são ambas positivas se, e 
somente se ac—b 2 > 0 e a > 0 (ou c > 0). Com efeito, ac —b 2 >0 (isto 
é, ac > b 2 ) diz que essas raízes têm o mesmo sinal. De a > 0 tiramos 
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c > b 2 /a > 0, logo a + c > 0 e o sinal comum das raízes é positivo. 
Portanto as condições a>0eac — b 2 >0 (ou c > 0 e ac — b 2 > 0) são 
necessárias e suficientes para que a matriz simétrica a seja positiva. 
Para que se tenha a > 0 é necessário e suficiente que ac — b 2 > 0, 


a > 0 e c > 0. Assim, por exemplo, a matriz 


-1 

2 


é positiva e 


1 i é não-negativa. 

Um operador X: E —> E chama-se raiz quadrada do operador 
A: E —> E quando X 2 = A. 

Para uso na demonstração do Teorema 13.8, apresentaremos 
uma noção que tem outras aplicações. 

Se À é um autovalor do operador A: E —> E, o conjunto 


Ea = (v G E; Av = Av} 

é um subespaço vetorial de E, invariante por A, chamado um auto- 
subespaço. Restrito a Ea, o operador A é simplesmente a multiplica¬ 
ção por À. Assim, todo vetor não-nulo em E A é um autovetor de A, 
com autovalor À. 

Quando A é auto-adjunto e Ai,..., À r são seus autovalores distin¬ 
tos então, pelo Teorema 13.4, para i / j, todo vetor em E Ài é orto¬ 
gonal a qualquer vetor em Ea ; . Além disso, pelo Teorema Espectral, 
todo vetor v G E se escreve, de modo único, como v = V] + • • • + v T , 
onde vi G Ea, ,... ,v T G Ea,., ou seja, E é soma direta dos subespaços 
i ■ • • i Ea t • 

Teorema 13.8. Todo operador não-negativo A: E —> E, num espaço 
vetorial de dimensão finita munido de produto interno, possui uma 
única raiz quadrada não-negativa, a qual é positiva se, e somente se, 
A é positivo. 

Demonstração: Sejam Ai > 0,..., A r > 0 os autovalores distintos 

de A. Todo vetor v G E se escreve, de modo único, como v = vH-b 

v T , onde vi G Ea, ,... ,v r G Ea t , logo Av = Aivi -I-+ A r v T . Definimos 

o operador linear B: E —> E pondo 

Bv = /Ã • Vi H-b \/\ • V T . 

Se w = W] + • • • + w r com W] G Ea p ...,w t g Ea,. então (ví, W j) = 0 
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para i / j, portanto 

r r 

(Bv,w) = VX( v u w i) = (v,Bw) e (Bv,v) = ç/Ãjvtl 2 . 

i=l i=1 

Logo B é um operador não-negativo. Além disso, é claro que B 2 v = Av 
para todo v € E, logo B é uma raiz quadrada de A. Para provar que 
é única a raiz quadrada não-negativa de A, começamos observando 
que toda raiz quadrada de A comuta com A. Com efeito, se C 2 = A 
então AC = C 2 C = CC 2 = CA. A observação seguinte é que se C 
comuta com A então cada um dos auto-subespaços de A é invariante 
por C. Com efeito, 


V € E A . => Av = A t v A(Cv) = C(Av) = CM = A t (Cv), 

logo Cv € E A .. 

Mais uma observação: se C é uma raiz quadrada não-negativa 
de A então, para cada i = 1,..., r, o único autovalor da restrição de 
C a E Al é \Ai- Com efeito, se w e E Ai é auto vetor de C, digamos com 
Cw = y • w, então \w = Aw = C 2 w = y 2 • w, logo A^ = y 2 e y = \fK[. 
Agora o argumento final: seja C uma raiz quadrada não-negativa de 
A. Cada auto-subespaço E Ai é invariante pelo operador auto-adjunto 
Ceo único autovalor de C em E Ai é Logo Cw = y/X ■ w para 

todo w € E A .. Então, dado v = Vi H-E v r , com vi € E A ,,..., v T € E At , 

tem-se 

Cv = v/Ã ' Vi + • • • + \/X ■ V r 

portanto C coincide com o operador B acima definido. A afirmação 
sobre a positividade da raiz quadrada é óbvia. □ 

Observação 1: Um dos argumentos acima usados permite mostrar 
que se dois operadores auto-adjuntos A, B comutam então eles têm 
um autovetor comum. Com efeito, seja Ai um autovalor de A. Como 
vimos acima, a hipótese AB = BA implica que o subespaço E A) = 
{v € E;Av = Aiv) é invariante por B. Pelo corolário do Teorema 
13.5, o operador auto-adjunto B possui um autovetor w € E Al . Mas 
todo vetor não-nulo em E Al é autovetor de A. Logo w é autovetor 
comum de A e B. Usando repetidamente o Teorema 13.2 conclui-se 
então que se dois operadores auto-adjuntos comutam então existe 
uma base ortonormal formada por autovetores de ambos. 
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Observação 2: Somente operadores não-negativos possuem raiz 
quadrada auto-adjunta, pois resulta imediatamente da definição de 
A* que o quadrado de um operador auto-adjunto é não-negativo. 
Entretanto, o quadrado de um operador de outro tipo pode ser um 
operador (auto-adjunto) negativo. Por exemplo, a rotação de 90° no 
plano tem quadrado igual à rotação de 180°, que é igual a —I. Além 
disso, um operador positivo pode ter uma raiz quadrada que não 
é auto-adjunta. Por exemplo, o operador A: M 2 —> M 2 , definido por 
A(x,p) = (2x—y,3x— 2y) é uma raiz quadrada daidentade I R 2 , como 
se pode ver sem dificuldade. 

Exemplos gerais de operadores não-negativos são dados pelo te¬ 
orema seguinte. 

Teorema 13.9. Seja A: E —> E uma transformação linear entre 
espaços vetoriais de dimensão finita munidos de produto interno. Os 
operadores A*A: E —> E e AA*: E —> E são não-negativos e têm am¬ 
bos o mesmo posto de A (e de A*). Em particular, são positivos se, e 
somente se, A é invertível. 

Demonstração: Como (A*A)* = A*A** = A*A, vemos que A* A é 
auto-adjunto e, semelhantemente, AA* também. Além disso, para 
todo v £ E, tem-se (A*Av,v) = (Av, Av) = |Av| 2 > 0 logo A*A > 0. 
Da mesma forma se vê que AA* > 0. Para determinar o posto de 
A*A, mostraremos inicialmente que AÍ{A*A) = Aí [A). A inclusão 
Aí[A] C AÍ[A* A) é óbvia, pois Aí [A) C AA(BA) seja qual for B: E —> E. 
Por outro lado, 

v € Aí [A* A) => A*Av = 0 

=» Av € Aí [A*) = Im(A) 1 
=> Av e Xm(A) n Im(A) 1 , 

logo v € Aí [A* A) => Av = 0, ou seja Aí [A* A) C Aí [A], que é a 
inclusão restante. Em seguida observemos que, pelo Teorema do 
Núcleo e da Imagem: 

posto de A*A = dim E — dimAA(A*A) 

= dim E — dim Aí[A] 

= posto de A. 

A afirmação análoga sobre AA* se prova do mesmo modo. □ 
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Corolário. A transformação linear A: E —> E é injetiva se, e somente 
se, A*A é invertível. A é sobrejetiva se, e somente se, AA* é invertível. 

Com efeito, A injetiva 44 posto de A = dim E 44 posto de A* A = 
dim E§A*A invertível. Mesmo argumento para AA*. □ 


Observação: O Teorema 13.9 e seu corolário podem ser enuncia¬ 
dos em termos de matrizes, substituindo-se A por a e A* por a T . 
Nesta formulação, dizer que A é injetiva equivale a afirmar que o 
posto da matriz a E M(m x n) é igual a n. Analogamente, A ser 
sobrejetiva equivale à matriz a ter posto m. Qualquer destas duas 
hipóteses sobre A, quando formulada em termos de matrizes, pode 
ser expressa na afirmação única de que a tem posto máximo, isto é, 
o posto de a € M(m x n) é o menor dos dois números m e n. Na 
prática, quando quisermos um exemplo de matriz positiva ou não- 
negativa, tomamos uma matriz a de posto máximo e consideramos 
as matrizes simétricas aa T e a T a. A maior delas é > 0 e a menor 
é > 0. 


Exemplo 13.6. Seja a 


1 2 3 
4 5 6 


Então as matrizes 





'17 22 27 ' 

aa T = 

'14 32 ' 
32 77 

e a T a = 

22 29 36 
27 36 45 


ambas de posto 2, são positiva e não-negativa, respectivamente. 

A seguir, uma extensão do Teorema Espectral, válida para trans¬ 
formações lineares quaisquer. 

Teorema 13.10. (Teorema dos Valores Singulares.) Seja A : E—>E 
uma transformação linear de posto r entre espaços de dimensão finita 
com produto interno. Existem bases ortonormais {ui,..., u n } c E e 
{vi,..., v m } c F tais que Aut = otVi., A*vt = OjUi, com oj. > 0 para 
i = 1,..., r e Aut = 0, A*ví = 0 se i > r. 

Demonstração: Pelo Teorema 13.9, o operador A*A: E —> E é não- 
negativo e tem posto r. O Teorema Espectral assegura a existência 
de uma base ortonormal {ui,..., u n } c E tal que A* Au^ = ofui, com 
Oi>0se1 <i<reoi = 0ser + l < i < n. Então 

(Aut, Aiij) = (ui,A*Auj) = of(ui,Uj). 
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Assim, os vetores Aui,..., Au r são dois a dois ortogonais, e não- 
nulos pois 

|Aui| 2 = ofluil 2 , 

logo |Aut[ = ot. (Na realidade, a prova do Teorema 13.9 mostra que 
Aí[A] = Aí [A* A), portanto Atq = 0 se r + 1 < j < n.) Podemos então 
escrever, para i = l,...,r, Atq = csyví, onde {vi,...,v r } C F é um 
conjunto ortonormal, de fato uma base ortonormal de Im(A), a qual 
pode ser completada a uma base ortonormal (vi,..., v m } c F, onde 
(v T+ i,... ,v m } é uma base ortonormal de Aí [A*). Tem-se A*Vi = 0 se 
i > r e, para i = 1,..., r: 

A* vi = — A*Auí = — of ut = oyui. □ 

Oi Oi 

Os números positivos oi ,..., o> chamam-se os valores singulares 
da transformação linear A: E —> F, de posto r. 

No teorema acima, podemos observar que {vi,..., v m } cFé uma 
base ortonormal de autovetores para o operador AA*: F —> F, pois 

(AA*)ví = A(ayui) = OíAuí = ofvi. 

Analogamente, {ui,..., u n } c E é uma base ortonormal de autoveto¬ 
res do operador A*A: E —> E. 

Vemos ainda que {ui,..., u T } é uma base ortonormal de Zm(A*), 
enquanto o conjunto ortonormal {vi,...,v T } é uma base para lm(A). 
Ao mesmo tempo, {u r+ i,..., u n ) c Aí [A) e (v r+ i,..., v 1TL } c Aí{ A *) são 
bases, desde que não sejam vazios. 


Exercícios 

Em todos os exercícios desta seção E é um espaço vetorial de di¬ 
mensão finita, munido de produto interno. 

13.1. Prove que duas projeções P, Q: E —> E são iguais se, e somente 
se, têm os mesmos auto-vetores com os mesmos auto-valores. Con¬ 
clua que uma projeção P: E —> E é auto-adjunta (portanto Zm(P) = 
A/XP)- 1 ) se, e somente se, é normal. (Veja Exerc. 12.7.) 

13.2. Sejam A,B: E —> E operadores auto-adjuntos tais que 
(Av,v) = (Bv, v) para todo v e E. Prove que A = B. 
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13.3. Se B é invertível e BAB* é auto-adjunto, prove que A é auto- 
adjunto. 

13.4. Sejam P uma projeção ortogonal e a > 0. Exprima a raiz 
quadrada positiva de I + aP em termos de P. 

13.5. Seja A auto-adjunto. Prove que A k v = 0 implica Av = 0. 

13.6. Assinale se cada um dos seguintes subconjuntos do espaço 
vetorial £(E) é um subespaço vetorial (S), um cone (C), um cone con¬ 
vexo (CC): 

( ) operadores normais (Veja Exerc. 12.7.) 

( ) operadores auto-adjuntos 

( ) operadores não-negativos 

( ) homotetias. 

13.7. Sejam S,T e C( E) involuções auto-adjuntas. Prove que ST é 
uma involução auto-adjunta se, e somente se, ST = TS. 

13.8. Dados os vetores v = (2,—1,-2), e w = (3,—6,—6), determine 
o operador auto-adjunto A: M 3 —> M 3 tal que Av = (1,1,13) e Aw = 
(3,21,33), sabendo que o traço de A é 5. 

13.9. Dados os vetores u = (4,4,—2), v = (4,—2,4) e w = (1,-2, 
—2), seja A: M 3 —> M 3 o operador linear tal que Au = (10,—2,—2), 
Av = (—2,10, —2) e Aw = (1,1, —5). Prove que A é auto-adjunto. 

13.10. Dado o subespaço FcE, considere as transformações lineares 
P:E—> E e J: E —> E, onde P é a projeção ortogonal (de núcleo E^) e 
Jv = v para todo v € F. (J chama-se a inclusão de E em E.) Determine 
as adjuntas P*: E —> E e J*: E —> E. 

13.11. Seja A: E —» E o operador de posto 1 definido por Av = (v, a) b. 
(E é um espaço vetorial de dimensão finita, com produto interno, e 
a, b € E são vetores não-nulos.) Prove que A é auto-adjunto se, e 
somente se, b é múltiplo de a. Além disso, A é não-negativo se, e 
somente se, pode-se tomar b = a. Dada uma base ortonormal em E, 
determine a matriz de A em função das coordenadas de a e b nessa 
base. (Veja Exercício 10.32.) 
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13.12. Se A* A = —A, prove que os autovalores de A pertencem ao 
conjunto {0,-1}. Dê exemplo de uma matriz a € M.(2 x 2), tal que 
aii = — j e a T a = —a. Quantas dessas matrizes existem? 

13.13. Seja A: E —> E auto-adjunto. Para todo k € N ímpar, mostre 
que existe um único operador auto-adjunto X: E —> E tal que X k = A. 
Se k é par, existe X auto-adjunto com X k = A se, e somente se, A > 0. 
Neste caso, X pode ser escolhido > 0 e então é único. 

13.14. Assinale V(erdadeiro) ou F(also): 

( ) Se todos os elementos de uma matriz simétrica são números 
positivos então essa matriz é não-negativa. 

( ) O produto de operadores não-negativos é um operador não-ne- 

gativo. 

( ) Um operador não-negativo é positivo ou é zero. 

( ) Uma matriz do tipo [cq • bj] é não-negativa se, e somente se, 
ai = bt (para todo i). 

( ) O posto de uma matriz não-negativa n x n pode ser qualquer 

número de 1 a n. 

( ) O inverso de um operador auto-adjunto (invertível) também é 

auto-adjunto. 

( ) Se existirem u,v e R 3 não-nulos, com Au = 2u, Av = 3v 
então existe uma base de autovetores para o operador linear 

A: R 3 —> R 3 . 

( ) Sejam ( , ) e [, ] produtos internos definidos em R 2 . Se um 
operador A é auto-adjunto relativamente a ( , ) então A tam¬ 
bém é auto-adjunto em relação a [, ]. 

13.15. Se o espaço vetorial E possui uma base formada por autove¬ 
tores do operador A: E -í E, prove que é possível definir em E um 
produto interno em relação ao qual A é auto-adjunto. 

13.16. Num espaço vetorial E, de dimensão finita, seja A um opera¬ 
dor diagonalizável (ou seja, E possui uma base formada por autove¬ 
tores de A). Se E c E é um subespaço invariante por A, prove que 
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a restrição de A ao subespaço F é um operador diagonalizável em F. 
(Sugestão: use o exercício anterior.) 

13.17. Seja A: E —> E um operador diagonalizável. Se o subespaço 
F] c E é invariante por A, prove que existe um subespaço F 2 C E, 
também invariante por A, tal que E = Fi ® F 2 . 

13.18. Se os operadores A, B: E —> E são auto-adjuntos, prove que 
AB + BA é auto-adjunto. Que se pode dizer sobre AB — BA ? 

13.19. Se A: E —> E é auto-adjunto, prove que, para todo B e £(E), 0 
operador B*AB também é auto-adjunto. Se A > 0, prove que B*AB > 
0. Se A > 0 e B é invertível, prove que B*AB > 0. 

13.20. Se dois operadores auto-adjuntos A, B: E —» E comutam, 
prove que 0 espaço E possui uma base ortonormal formada por auto- 
vetores comuns a A e B. Prove também a recíproca. 

13.21. Assinale V(erdadeiro) ou F(also): 

( ) O conjunto dos operadores positivos é um cone convexo no es¬ 
paço vetorial £(E). 

( ) O conjunto dos operadores não-negativos é um subespaço veto¬ 
rial de £(E). 

( ) Os elementos da diagonal de uma matriz positiva são números 
positivos. 

( ) Se A é auto-adjunto e B é invertível então B 1 AB é auto-adjunto. 

( ) Existe uma matriz positiva 2x2 com dois elementos negativos 
e dois positivos. 

( ) Se A: M n —> R n é um operador invertível qualquer, alguma 

base ortogonal de M n é transformada por A numa base ortogo¬ 
nal. 

( ) Se 0 operador A é auto-adjunto então 0 traço de A é igual à 
soma dos seus autovalores. 

13.22. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Um subconjunto L c E chama-se um elipsóide quando 
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existem uma base ortonormal {ui,..., u n } C E e números positivos 
ai,..., a n tais que Zé o conjunto dos vetores v = xiui + • • • + x n u n 
cujas coordenadas satisfazem a equação ai xf + ••■ + a n x^ = 1. 
Seja A: E —> E um operador invertíveL Prove que todo elipsóide Z é 
transformado por A num elipsóide Z'. 

(Sugestão: use o Teorema 13.10.) 

13.23. Seja Z um subconjunto de um espaço vetorial de dimensão 
finita, com produto interno. Prove que Z é um elipsóide se, e somente 
se, existe um operador positivo A: E —> E tal que 

Z ={v € E; (Av, v) = 1}. 

13.24. Num espaço vetorial E, de dimensão finita, com produto in¬ 
terno (u,v), seja B um operador positivo. Prove que [u,v] = (Bu,v) 
define um novo produto interno em E. Se A: E —> E é auto-adjunto 
no sentido do produto interno original, prove que A é também auto- 
adjunto no sentido do novo produto interno se, e somente se, 
AB = BA. 

13.25. Sejam A: E —> E auto-adjunto e B: E —> E positivo. Prove: 

(a) Se X é a raiz quadrada positiva de B então XAX é auto-adjunto. 

(b) v é autovetor de XAX se, e somente se, Xv é autovetor de BA. 

(c) E possui uma base (não necessariamente ortogonal) de autove- 
tores de BA. (Ou seja, BA é diagonalizável.) 

13.26. Se A: E —» E é auto-adjunto eB:E-iEé positivo, prove que 
E possui uma base V tal que, para todo v e V, existe À e K com 
Av = ÀBv. (“Problema de autovalores generalizados”.) 

13.27. Sejam A, B operadores auto-adjuntos no mesmo espaço veto¬ 
rial. Se BA é diagonalizável, prove que AB também é diagonalizável. 
(Veja Exercício 12.35.) 

13.28. Dada a transformação linear A: E —> E, entre espaços veto¬ 
riais de dimensão finita munidos de produto interno, seja a 2 o maior 
autovalor do operador A*A: E —> E (u > 0). Prove que a é o maior 
dos números |Au|, onde u é qualquer vetor unitário em E. Escreve- 
se ||A|| = cr = max{|Au|;u e E, |u| = 1} e diz-se que ||A|| é a norma 
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espectral da transformação linear A. Seja |A| = y / tr(A*A) a norma 
induzida pelo produto interno (A, B) = tr(A*B), definido no Exercício 
11.17. Se crf,..., cr^ são os autovalores de A*A, tem-se 

|A| = \Ja] H-hffj e ||A|| = max ov 

Conclua que ||A|| < |A| < a/Ü-IIAH. 

13.29. Prove que todo operador auto-adjunto A: E —> E pode ser 
escrito como A «= Ài Pi -t-1- A m P m onde: 


(1) Ai < • • • < A m . 

(2) Pf = Pi = P^,...,P^ = P m = P^. (Cada P| é uma projeção 
ortogonal.) 

(3) PiPj = 0 se i / j. 

(4) Pt + ■ ■ ■ + P m = I. 

Prove também que a expressão A = IAíPí com as propriedades 
(1) a (4) acima é única. (Sugestão: Ai < ■ ■ ■ < A m são os autovalores 
distintos de A e Pi é a projeção ortogonal sobre o auto-espaço E* t , 
definido no Exercício 12.23.) 

13.30. Prove que todo operador auto-adjunto é soma de operadores 
auto-adjuntos de posto 1, os quais podem ser tomados não-negativos 
se A for não-negativo. [Sugestão: Teorema Espectral.] 

13.31. Chama-se produto de Hadamard de duas matrizes a = [ay], 
b = [bij] e M(m xn]à matriz c = [cy] € M(m x u) com cy = ay • by. 
Prove que o produto de Hadamard de duas matrizes não-negativas 
é uma matriz não-negativa. (Use o fato de que toda matriz não- 
negativa pode escrever-se como soma 

a = ^ a ,T ^ 

r 

de matrizes não-negativas de posto 1, cada uma das quais tem a 
forma a ír) = [a| r) • aj r| ].) (Veja o exercício anterior.) 
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13.32. Prove que a norma espectral, definida no Exercício 13.18, tem 
as propriedades 

l|A + B||<||A|| + ||B|| e ||BA|| < ||B|| ||A||. 

Dê exemplo de um operador A: R 2 —> M 2 para o qual se tem 

11A 2 11 < IIAII 2 . 

13.33. Prove que a norma |A| = v /tríA*A), proveniente do pro¬ 
duto interno introduzido no Exercício 11.17, cumpre a desigualdade 
|BA| < |B| |A|. 

13.34. Seja A: E —* E auto-adjunto. Se u € E é tal que Au / 0 e 
(Au, u) = 0, mostre que existem v, w € E com (Av, v) > 0 e (Aw, w) < 
0. Deduza daí o Cor. 1 do Teor. 13.7 sem usar o Teorema Espectral. 
(Sugestão: considere tu + Au para valores convenientes de t.) 
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Sob o ponto de vista da organização geral da Matemática, os opera¬ 
dores ortogonais são os automorfismos da estrutura de espaço veto¬ 
rial com produto interno, ou seja, são as simetrias dessa estrutura. 
Do ponto de vista mais pedestre em que nos colocamos, os operadores 
ortogonais são aqueles para os quais se podem obter as matrizes mais 
simples, depois dos auto-adjuntos. Eles possuem as propriedades 
geométricas mais marcantes, muitas das quais lhes são exclusivas. 
(Vide Teorema 14.1.) Nesta seção consideramos, mais geralmente, as 
transformações lineares ortogonais de um espaço noutro e as matri¬ 
zes ortogonais não-quadradas. Obtemos a forma mais simples que 
pode assumir a matriz de um operador ortogonal e concluímos de¬ 
monstrando que todo operador é o produto de um não- negativo por 
um ortogonal (forma polar). 

Nesta seção, estenderemos para espaços vetoriais com produto 
interno a noção de congruência entre figuras da Geometria Elemen¬ 
tar. Lembramos que uma congruência entre duas figuras X, Y é uma 
bijeção f: X —> Y que preserva distâncias, isto é, tal que 
d(f(x),f(x')) = d(x,x') para quaisquer x,x' € X. Note-se que, 
embora não garanta a sobrejetividade, a propriedade de preservar 
distâncias já assegura que f é injetiva pois f(x) = f(x') => d(x,x') = 

d(f(x),f(x')) = 0=^x = x'. 


Seção 14 


Operadores Ortogonais 175 


Na discussão a seguir, um papel central é desempenhado pelos 
conjuntos ortonormais {ui,..., u n } c R m . Uma matriz u E M(m x u] 
cujas n colunas formam um conjunto ortonormal em R m chama-se 
uma matriz ortogonal. 

Se ui,..., u n E R m são as colunas da matriz u = [ay] E M(mxn), 
a condição para que u seja ortogonal é que (uyiij) = 0 se i / j e 
(uí, ui) = 1, onde i, j = 1,..., n. Noutras palavras, deve-se ter 


m 

y a ki a kj = 

k=1 


(*) 


(Estamos usando aqui, mais uma vez, o símbolo ôy, conhecido como 
“delta de Kronecker”, que vale 0 se í / j e 1 se i = j.) A igualdade (*) 
significa precisamente que o produto u T ■ u da transposta u T por u é 
igual à matriz identidade n x n. 

Portanto a matriz u E M(m x n) é ortogonal se, e somente se, 
u T u = I n . 

Se u E M(m x n) é ortogonal então seu posto é n (logo m > n), 
pois suas n colunas são vetores L.I. no espaço R m . Quando m = n e 
u E M(n x n) é uma matriz quadrada ortogonal então a igualdade 
u T • u = I n implica u • u T = I n logo u T = u 1 . (Vide Corolário do 
Teorema 6.7 ou a propriedade 7) do produto de matrizes na Seção 8.) 
Assim, matrizes quadradas ortogonais são aquelas cuja transposta 
é igual à inversa. 

A igualdade u • u T = I n significa que as linhas de u formam um 
conjunto de n vetores ortonormais em R m . Portanto, para matrizes 
quadradas, colunas ortonormais equivale a linhas ortonormais. 

Se u e M(n x p), v € M(m x n) são ortogonais então (vu) T vu 
= u T v T vu = u T I n u = u T u = I p logo o produto vu é ortogonal. Se 
u E M(u x n) é ortogonal então (u T ) T • u T = u • u T = I n logo u T = u 1 
também é ortogonal. 

Evidentemente, se m > n, as m linhas de uma matriz ortogonal 
u e M(m x n) não podem formar um conjunto ortonormal pois são 
vetores em R n , logo u T não é ortogonal quando u não é quadrada. 
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Exemplo 14.1. A matriz u, cujas colunas são os vetores 


Ui 


u 2 


U3 


1 2 V 
y 3 ’ 3j ’ 
2 1 2 N 
3 ’ 3 ’ 3 
2 2 1 
3 ’ 3 ’ _ 3 . 


e 


é ortogonal. 

Exemplo 14.2. (Matrizes ortogonais 2 x 2.) Seja 


u = 


a 

c 


b 

d 


uma matriz ortogonal 2x2. Como ui = (a, c) é um vetor unitário 
em M 2 , existe 0 e R tal que a = cos 0, c = sen 0. Sendo u 2 = (b, d) 
unitário e perpendicular a ui, devemos ter u 2 = ±(— sen 0,cos 0). 
Assim, há duas possibilidades para a matriz u: 



cos 0 

— sen 0 



cos 0 

sen 0 

U = 

sen 0 

cos 0 

ou 

u = 

sen 0 

— COS0 


No primeiro caso, tem-se ad — bc = 1 e no segundo ad — bc = —1. 

No primeiro caso, o polinómio característico de u, p(À) = A 2 — 
(2 cos 0)A + 1, não tem raízes reais salvo se 0 = 0 ou 0 = 180°, casos 
em que u = ±I 2 . Trata-se da matriz de uma rotação. No segundo 
caso, p(A) = A 2 — 1 tem raízes ±1. Então o operador U: M 2 —> M 2 cuja 
matriz (na base canônica) é u admite autovetores vi, v 2 , com Uvi = 
vi e Uv 2 = —v 2 . Observe que, neste caso, a matriz u é simétrica, o 
operador U é auto-adjunto, {vi, v 2 ) c M 2 é uma base ortonormal e U 
é a reflexão em torno do eixo que contém vi, paralelamente a v 2 . 

Exemplo 14.3. (Matriz de passagem ortogonal.) Sejam U = 
{ui,... , u n } c EeW' = {u^,..., u(J c E bases ortonormais. A ma¬ 
triz de passagem p = [ptj] de U para W é uma matriz ortogonal. 
Com efeito, para quaisquer i, j = 1,..., n, temos 

n n 

u[ = e u- = Y pk)U k , 

k=l k=1 
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logo 

n 

5ij = = J^pkiPkj, 

k=1 

portanto p T • p = I n . As últimas 2 igualdades da linha acima mos¬ 
tram que, reciprocamente, se a matriz de passagem p é ortogonal, 
então U ortonormal =4> W ortonormal. 

Teorema 14.1. As seguintes afirmações a respeito de uma trans¬ 
formação linear A: E —> F, entre espaços vetoriais de dimensão finita 
providos de produto interno, são equivalentes: 

(1) A preserva norma: |Av| = |v| para todo v € E; 

(2) A preserva distância: |Au—Av| = |u—v| para quaisquer u,v € E; 

(3) A preserva produto interno: (Au, Av) = (u,v) para quaisquer 
u,v G E; 

(4) A* A = Ie ; 

(5) A matriz de A relativa a qualquer par de bases ortonormais 
U C E, V C E é uma matriz ortogonal; 

(6) A matriz de A relativa a um certo par de bases ortonormais 
U C E, V C E ê uma matriz ortogonal. 

(7) A transforma uma certa base ortonormal U C E num conjunto 
ortonormal A c E. (Se dim E = dim E, A é uma base.) 

(8) A transforma toda base ortonormal WcE num conjunto orto¬ 
normal Z C E. 

Demonstração: Se vale (1) então |Au — Av| = |A(u — v)| = |u — v|, 
logo (1) => (2). Se vale (2) então 

(Au, Av) = 1 [|Au| 2 + |Av| 2 - |Au - Av| 2 ] 

= ^[|u| 2 + |v| 2 -|u-v| 2 ] = (u, v), 

logo (2) => (3). Se vale (3) então, para quaisquer u,v € E tem-se 
(u,v) = (Au, Av) = (A*Au,v), portanto A*Au = u para todo ueE, 
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donde A*A = Ie, logo (3) => (4). Se vale (4) e a é a matriz de A nas 
bases ortonormais U C E, V C F então a T • a = I n e a é uma matriz 
ortogonal, logo (4) => (5). Obviamente (5) => (6). Se vale (6), sejam 
U = {ui,..., u n ), V = {vi,..., v m } e a = [cuj] a matriz ortogonal de A 
nessas bases. De 

m m 

Aut = J_ Q ki v k e Au, = Y_ a kjVk 

k=1 k=l 

resulta 

m 

(Aut, Auj) = Y_ a kiikj = §ij, 

k=1 

logo X = {xi,..., x n ) C F, com Xi = Aut, é um conjunto ortonormal e 
(6) => (7). Se vale (7), seja W = {wi,..., w n } c E uma base ortonor¬ 
mal qualquer. Para i, j = 1,..., u, temos 

wí = Y PkiUk e Wj = Y PkjUk, 

k k 

onde a matriz de passagem p = (py) é ortogonal, pelo Exemplo 14.3. 
Pondo Z = (zi,..., Zn}, onde Zi = Aw,, vem, para i, j = 1,..., n: 

n n n 

Zi = Y_ PkiAUk = Y_ Pki*k e Z) = Y_ Pkj^k • 

k=l k=1 k=l 

Como X = {xi,..., x n } é ortonormal, resulta daí que 


(2H>Zj) — y~ PkiPkj — ^tj , 

k=1 

logo Z é ortonormal e ( 7 ) => (8). 

Finalmente, se vale (8), seja U = {ui,..., u n } c E uma base ortonor¬ 
mal. Para todo u = oq ui H-h a n u R £ E tem-se 

iui 2 = y «f. 

i=1 

Como {Aui,..., Au n ) c E é um conjunto ortonormal, 


|Au| 2 


n 

y~ <xí a U[ 

i=l 


= «i = m 2 > 

i=l 


2 
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logo |Au| = |u| e (8) => (1). tJ 

Observação. O Teorema 14.1 confirma o dito: enunciado longo => 
demonstração fácil. (Dito válido com a mesma precisão e generali¬ 
dade com que costumam valer os provérbios.) 

Uma transformação linear A: F —> F chama-se ortogonal quando 
cumpre uma das oito condições do Teorema 14.1 (e portanto todas 
elas). Em particular, um operador linear A: F —> E chama-se orto¬ 
gonal quando A* = A“ 1 . Para que o operador linear A: F —* E seja 
ortogonal, é suficiente que A* A = I E ou então que AA* = I E . 

De |Av| = |v| resulta que os únicos autovalores possíveis para um 
operador ortogonal A: F —> E são +1 e — 1. Com efeito, Av = Av com 
v / 0 implica |v| = |Av| = |Av| = |A| |v|, logo |A| — 1. 

Se u e v são autovetores do operador ortogonal A, com Au = u e 
Av = —v então (u,v) = 0. Com efeito: 

(u, v) = (Au, —Av) = (A*Au, —v) = (u, —v) = — (u, v). 


Teorema 14.2. Se o operador ortogonal A: F —> F deixa invariante 
o subespaço F c F então A deixa invariante o complemento ortogo¬ 
nal F- 1 . 

Demonstração: Dado arbitrariamente w e F -1 , queremos provar 
que Aw e F- 1 , isto é, que (Aw,v) = 0 para todo veF. Ora, a restrição 
de A ao subespaço invariante F é um operador injetivo A: F —> F, logo 
sobrejetivo. Assim, dado v € F, existe u € F tal que v = Au. Logo 

(Aw, v) = (Aw, Au) = (w, u) = 0, pois w € F 1 e u e F. jGJ 

Observação. Parte do argumento acima mostra que se o operador 
A: F —> F é invertivel eFcFé invariante por A, então F é invariante 
por A -1 . 

Exemplo 14.4. Uma operador linear S: F —> F que é ao mesmo 
tempo ortogonal e auto-adjunto cumpre S*S = I e S* = S, logo 
SS = I. Portanto ortogonal + auto-adjunto =)> involução. Pelo Te¬ 
orema 7.3, tem-se F = Fi © ? 2 , onde Fi = (v € F;Sv = v} e F 2 = {v e 
F; Sv = —v}. Assim, os elementos não-nulos de F] e F 2 são os autoveto¬ 
res de S correspondentes aos autovalores +1 e —1 respectivamente. 
Da observação que precede 0 Teorema 14.2 resulta que F 2 = (F])- 1 -. 
Juntando-se uma base ortonormal de Fi com uma base ortonormal 
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de E 2 obtém-se uma base ortonormal de E em relação à qual a ma¬ 
triz de S é diagonal, com a diagonal da forma (1,..., 1, —1,..., —1). 
O operador S é uma reflexão ortogonal. O leitor pode verificar sem 
dificuldade que duas quaisquer das seguintes propriedades de um 
operador linear S: E —> E implicam a terceira: (a) SS = I; (b) S* = S; 
(c) S* =S- 1 . 

Em seguida, examinaremos como pode ser um operador ortogo¬ 
nal A: E —> E num espaço vetorial de dimensão 2, dotado de um 
produto interno. 

Segundo a natureza dos autovalores de A, há quatro possibilida¬ 
des: 

(1) A possui um único autovalor, o qual é igual a 1. Neste caso, A = I. 
Com efeito, seja u € E um vetor unitário tal que Au = u. Se v e E 

é outro vetor unitário, perpendicular a u, então Av também é um 
vetor unitário perpendicular a u, pelo Teorema 14.2, logo Av = ±v. 
Como A não admite o autovalor —1, deve ser Av = v. Mas {u,v} c E 
é uma base, portanto A = I. 

(2) A possui um único autovalor, o qual é igual a —1. Então A = —I. 
O raciocínio é inteiramente análogo ao anterior. 

(3) A admite os autovalores 1 e — 1. Então tomamos vetores unitários 
u, v € E com Au = u e Av = —v, logo {u, v}cEé uma base ortonor¬ 
mal, relativamente à qual a matriz de A é 

4 0 ' 

0 ' 

Neste caso, A é a reflexão ortogonal em torno do eixo que contém o 
vetor u. 

(4) A não possui autovalores (reais). 

Então tomamos uma base ortonormal arbitrária {u,v} c E. A 
matriz de A nesta base, sendo ortogonal 2x2 sem autovalores, tem, 
segundo o Exemplo 14.2, a forma 

_ cos 0 — sen 0 
sen 0 cos 0 

Somos tentados a dizer que, neste caso, o operador A: E —> E é a 
rotação de ângulo 0. Mas para isso é necessário verificar se 0 não 
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depende da base ortonormal W = {u,v}cE escolhida. Ora, se tomar¬ 
mos outra base ortonormal W = {u', v'} C E, a nova matriz de A será 
a' = p 'ap, onde 


P = 


a 

c 


b 

d ’ 


matriz de passagem de U para W, é ortogonal, logo p 1 = p T . Assim, 


a 

c 


cos 0 — sen 0 


a b 

b 

d 


sen 0 cos 0 


c d 


Levando em conta a ortonormalidade das linhas e das colunas da 
matriz p, um cálculo fácil mostra que se tem 


cos 0 — sen 0 

sen 0 cos 0 


cos 0 

sen 0 


cos(—0) 

— sen(—0) 

— sen 0 

cos 0 


sen(—0) 

cos(—0) 


conforme seja ad — bc = 1 ou ad — bc = —1 respectivamente. 
Noutras palavras, o ângulo 0 fica determinado a menos do sinal. 
Isto quer dizer que, num espaço vetorial de dimensão 2, munido de 
produto interno, faz sentido a noção de ângulo apenas em valor abso¬ 
luto. Para que se possa falar no ângulo dotado de sinal é preciso in¬ 
troduzir uma orientação em E, isto é, escolher uma base ortonormal 
{u,v} c E, chamá-la de positiva e declarar que são também positi¬ 
vas todas as bases ortonormais de E que se obtêm a partir desta por 
meio de matrizes de passagem ortogonais cujo determinante ad —bc 
é igual a 1. De qualquer modo, com ou sem orientação, os opera¬ 
dores ortogonais sem autovalores (juntamente com ±1) num espaço 
vetorial de dimensão 2 serão chamados rotações. (I e —I são respec¬ 
tivamente as rotações de ângulo 0 o e 180° respectivamente.) 

Teorema 14.3. Seja A: E —> E um operador ortogonal num espaço 
vetorial de dimensão finita munido de produto interno. Existe uma 
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base ortonormal de E relativamente à qual a matriz de A tem a forma 

n i 


i 




cos ai — sen oq 
sen ai cos oq 


cos cx-k —sen ak 
sen o© cos a.k 

onde os termos não aludidos são iguais a zero. 

Demonstração: Os conjuntos Ei = {v e E;Av = v} e E 2 = {v e 
E;Av = — v} são subespaços vetoriais invariantes por A, com Et n 
E 2 = {0}. Logo F = Fi © E 2 também é um subespaço invariante por 
A, 0 mesmo acontecendo com 0 complemento ortogonal F- 1 . Seja 
{ui,...,u T } c E uma base ortonormal cujos primeiros vetores for¬ 
mam uma base de Ei e os restantes uma base de E 2 . Nenhum su¬ 
bespaço de dimensão 1 em E- 1 é invariante por A, logo existe um 
subespaço invariante G C E- 1 de dimensão 2. Seja {vi,wi} c G uma 
base ortonormal. Como vimos acima, tem-se Avi = cos oq ■ vi + 
sen ot i • wi, Awi = — sen aq ■ vi + cos cq • wi. Novamente, 0 com¬ 
plemento ortogonal de G em f- 1 é um subespaço invariante por A, 
que não possui autovetores, logo contém um subespaço invariante 
de dimensão 2. Prosseguindo analogamente, chegaremos a uma 
base ortonormal {vi, wi,..., Vk, w^} c F- 1 tal que Av t = cos cqvi + 
sen oqvt e Awí = — sen cqvi + cos cqwi para i = 1,..., k. Então 
{ui,..., u T , vi, W ],..., Vk, Wk} C E é uma base ortonormal, relativa¬ 
mente à qual a matriz de A tem a forma desejada. □ 

Observação. A matriz a que se refere 0 Teorema 14.3 pode não 
possuir elementos iguais a 1, ou a —1, como pode também não conter 
nenhum dos blocos 2x2, característicos de rotações. Além disso, caso 
seja conveniente, cada bloco igual a I 2 ou a —12 pode ser substituído 
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respectivamente pelos blocos 

cos 0 — sen 0 
sen 0 cos 0 

Corolário. Se E tem dimensão ímpar, todo operador ortogonal 
A: E —> E possui um autovetor v, com Av = v ou Av = —v. 

Exemplo 14.5. Seja A: M 3 —> M 3 um operador ortogonal no espaço 
euclidiano tri-dimensional. Se A ^ ±1 então existe uma base orto- 
normal {ui,U2,U3} C M 3 em relação à qual a matriz de A tem uma 
das quatro formas abaixo: 





'1 

0 

0 ' 


'1 

1 

o 

o 





0 

1 

0 


0 

-1 0 

> 




0 

0 

-1 


0 

0 -1 


'1 

0 



0 



'-1 

0 

0 

0 

cos 

oc 

— sen a 

> 

0 

cos a 

— sen a 

0 

sen 

a 

cos 

a 


0 

sen a 

cos a 


No primeiro caso A é a reflexão em torno do plano que contém os 
vetores U], U 2 (paralelamente a u 3 ). No segundo caso, A é a reflexão 
em torno do eixo que contém ui ou, o que é o mesmo, a rotação de 
180° em torno desse eixo. No terceiro caso, A é a rotação de ângulo 
a em torno do eixo que contém ui. No último caso, A é essa rotação 
seguida da reflexão em torno do plano que contém u 2 e u 3 . Estas 
quatro possibilidades, mais A = I e A = -1, esgotam todos os tipos 
de operadores ortogonais em M 3 . 

Teorema 14.4. Seja E um espaço vetorial de dimensão finita, mu¬ 
nido de produto interno. Todo operador linear A: E —> E admite 
uma decomposição da forma A = PU, onde U: E —> E é ortogonal e 
P: E —> E é não-negativo. 

Demonstração: De acordo com o Teorema 13.10, existem bases or- 
tonormais (ui,..., u n } c E, {vi,..., v n ) cEe números Ai > 0 tais que 
Au 3 = ÀtVi para i = 1,..., n. Definamos os operadores P, U: E —> E 
impondo que Pv 3 = A 3 ví e Uu L = Vj.. Evidentemente, P é auto-adjunto, 
>0, Ué ortogonal e PU = A. □ 

A expressão A = PU chama-se uma decomposição polar do ope¬ 
rador A, por analogia com a forma polar z = re 10 de um número 


ou 


cos 7T — sen n 
sen 7T cos n 
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complexo. Os fatores P e U são univocamente determinados a partir 
de A, no caso em que A é invertível. Provemos isto. E claro que 
A invertível obriga P a ser também invertível, donde positivo. De 
A = PU tiramos A* = U*P e, multiplicando membro a membro estas 
igualdades, vem A A* = PUU*P = P 2 , portanto P é a raiz quadrada 
positiva do operador positivo AA*. (Vide Teorema 13.8.) Multipli¬ 
cando a igualdade A = PU por P _1 à esquerda, vem U = P _1 A. Isto 
mostra que, no caso em que A é invertível, P = \J AA* e U = P _1 A 
são univocamente determinados a partir da igualdade A = PU. 


Exercícios 

14.1. Prove que as linhas de uma matriz a são duas a duas orto¬ 
gonais se, e somente se, aa T = d, onde d é uma matriz diagonal. 
Enuncie e prove um resultado análogo sobre a ortogonalidade das 
colunas de a. 

14.2. Se as linhas de uma matriz quadrada forem duas a duas orto¬ 
gonais e tiverem a mesma norma, prove que as colunas dessa matriz 
também são duas a duas ortogonais. 

14.3. Dê os seguintes exemplos: 

(a) Uma matriz invertível cujas linhas são duas a duas ortogonais 
mas as colunas não são. 

(b) Uma matriz (não-quadrada) cujas linhas são ortogonais e têm 
a mesma norma mas as colunas não são ortogonais. 

(c) Uma matriz cujas linhas (e colunas) são duas a duas ortogonais 
mas as normas das linhas são diferentes. 

14.4. Seja f: R n —> M n uma função tal que f(0) = 0 e |f(u) — f(v)| = 
|u — v| para quaisquer u, v e M n . (Ou seja: f deixa 0 hxo e preserva 
distâncias.) Prove: 

(a) Para todo v e R n , tem-se |f(v)j = |v|. 

(b) Para quaisquer u,v € R n , tem-se (f(u),f(v)) = (u,v). [Use a 
igualdade (u,v) = ^ÍM 2 + kl 2 — |u — v| 2 ).] 
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(c) Os vetores ui = f(eiu n = f(e n ) formam uma base orto- 
normal em M n . 

(d) Para todo v = xi eH-h x n e n G M n , tem-se (f(v), ut) = xi, logo 

f(v) = xiUi H-1- x n u n . 

(e) f: M n —> M n é um operador linear, logo é ortogonal. 

Uma função g: M n —> M n chama-se uma isometria quando |g(u) — 
g(v)| = |u — v| para quaisquer u, v G M n . Conclua que toda isometria 
tem a forma g(v) = A-v + b, onde A: M n —> M n é um operador (linear) 
ortogonal e b G M n é um vetor constante (independente de v). 

14.5. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Se A 0 : E —> E é uma transformação linear ortogonal defi¬ 
nida num subespaço vetorial E c E, prove que existe um operador 
ortogonal A: E —> E tal que A • v = A 0 • v para todo v G E. 

14.6. Sejam A:E —» G e B: F —> H transformações lineares in- 
vertíveis. (G e H são espaços de dimensão finita, munidos de produto 
interno.) Prove que existe uma transformação ortogonal (invertível) 
C: G —> H com B = CA se, e somente se, |Av| = |Bv| para todo v G F. 

14.7. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Dados dois operadores A,B: E —> E tais que |Av| = |Bv| 
para todo v G E, prove que existe C: E —> E ortogonal, com B = 
CA. (Sugestão: observe que ÁÍ[A) = AA(B). Considere F = AA(A )- 1 
e sejam A 0 : F —> Im(A), B 0 : F —> Zm(B) os isomorfismos obtidos 
por restrição de A e B respectivamente. Use o exercício anterior 
para achar C 0 : Zm(A) —> Im(B), com B 0 = C 0 A 0 e obtenha C pelo 
Exercício 14.5.) 

14.8. Dada uma base ortonormal {ui,U 2 ,U 3 } C M 3 , sejam n,p G N 
tais que p = n 2 + n + 1. Defina um operador A: M 3 —> M 3 pondo 
Aui = vi, Au 2 = V 2 , AU 3 = V 3 , onde 

V] = -[uui + (n + l)u 2 + n(n+ l)u 3 ], 

P 

V 2 = - [n(n + 1 )ui + nu 2 — (n + 1 )u 3 ], 

P 

v 3 = - [(n + 1 )ui — n(n + 1 )u 2 + nu 3 ]. 

P 
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Prove que o operador A é ortogonal. 

14.9. Para quaisquer duas bases ortonormais U = {ui,..., u n } cte 
V = {vi,...,v n } c E, prove que existe um operador ortogonal A: E —> 
E tal que Aui = vi,..., Au n = v n . Se as bases dadas são formadas 
pelos vetores 

ui =1(1,2,2), u 2 = 1(2,1,-2), u 3 = 1(2, —2,1) e 

V! — ^(2,3,6), v 2 = 1(6,2,—3), v 3 = 1(3,-6,2) em M 3 , 

determine a matriz de A na base canônica de M 3 . 

14.10. Dado o vetor unitário u G M n , prove que o operador H u : M n —> 
M n , definido por H u -v = v—2 (v, u) u, é ortogonal. (Reflexão em torno 
de {u}- 1 .) Dados os vetores v / w em ]R n , com |v| = |w|, mostre que, 
tomando u = (v — w)/|v — w|, tem-se H u v = w. Determine a matriz 
de H u em função das coordenadas de u (“matriz de Householder”). 

14.11. Prove que todo operador A: E —> E, num espaço vetorial de 
dimensão finita munido de produto interno se escreve como A = UP, 
onde U é ortogonal e P é não-negativo. (Faça a decomposição polar 
de A*.) 

14.12. Com a notação do Exercício 11.17, considere um operador 
ortogonal A G £(E) e defina Ma: £(E) —> £(E) pondo Ma • X = AX. 
Prove que Ma é um operador ortogonal. 

14.13. Se uma matriz ortogonal é triangular, prove que ela é diago¬ 
nal e seu quadrado é igual à matriz identidade. 

14.14. Seja E um espaço vetorial de dimensão finita, com produto 
interno. Uma função S: E —> E chama-se uma semelhança quando 
existe um número r > 0 (chamado a razão de semelhança) tal que 
|S(u)—S(v)| = r|u—v| para quaisquer u, v G E. Se S é uma semelhança 
de razão r, prove que existem um operador ortogonal A: E —> E e um 
vetor b G E tais que S(v) = r.Av + b para todo v G E. 

14.15. Seja A: E —> E um operador linear que transforma vetores 
unitários em vetores unitários. Prove que A é ortogonal. Deduza 
daí que se S: E —> E é um operador linear invertível que transforma 
dois quaisquer vetores de mesmo comprimento em vetores de mesmo 
comprimento então S é uma semelhança. 
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14.16. Seja S: E —> E um operador linear invertível que preserva 
ângulos, isto é 

(Su, Sv) _ (u, v) 

|Su| |Sv| |u| |v| 

quando u/Oev/O. Prove que S transforma vetores ortogonais de 
mesmo comprimento em vetores ortogonais de igual comprimento. 
Conclua que S é uma semelhança. 

14.17. Com o produto interno introduzido no Exercício 11.17, prove 
que os operadores ortogonais têm norma igual a v / u, onde u= dim E. 

14.18. Se a decomposição polar de um operador é única, prove que 
esse operador é invertível. 

14.19. Seja A: M 3 —> M 3 dado por A(x,y,z) = (2x + 3y — 6z,6x + 
2y + 3z, —3x + 6y + 2z). Mostre que A é uma semelhança de razão 
7. Sabe-se que ou existe v € M 3 com Av = 7v ou existe w € M 3 
com Aw = —7w. Ache um autovetor de A, complete-o de modo a 
obter uma base ortonormal de M 3 e determine a matriz do operador 
A nesta base. 

14.20. Seja a = h Q 2 ... a n ] e M(1 x n) tal que af + ■ • • + a 3 = 1. 
Prove que a T a € M(n x n) é a matriz de uma projeção ortogonal. 
Determine a imagem e o núcleo dessa projeção. 

14.20. Pode uma matriz ortogonal ser anti-simétrica? 

14.21. Seja a uma matriz ortogonal u x n. 

(a) Prove que A: M(u x n) —> M(n x n), definida por Ax = ax T + 
xa T , é uma transformação linear cuja imagem é o conjunto das 
matrizes simétricas. 

(b) Prove que, dada uma matriz simétrica s € M(nxn), o conjunto 
das matrizes x tais que ax T + xa T = s é uma variedade afim de 
dimensão n(n — 1 )/2 no espaço vetorial M(u x n). 


14 . 22 . Ache uma matriz ortogonal 4x4 cujos elementos são todos 
da forma ± \ . 
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14.23. Seja v = (a, b, c) um vetor unitário diferente de ±e$ . Mostre 
que existe x tal que a matriz abaixo é ortogonal: 

abc 
bx —ax 0 
acx bcx —1 /x 


14.24. Um operador auto-adjunto N: E —> E chama-se negativo 
quando (Nv,v) < 0 para todo v / 0 em E. Determine a (única) de¬ 
composição polar de um operador negativo N. 


14.25. Prove que os elementos da diagonal de uma matriz negativa 
são números negativos. 


14.26. Prove que a matriz abaixo é negativa 


-34 

12 


12 

-41 


14.27. Ache a decomposição polar da matriz . 

14.28. Sejam a e M(r x r) e c € M(s x s) matrizes ortogonais. 
Prove que a matriz (r + s) x (r + s) abaixo é ortogonal se, e somente 
se, b = 0: 

a b 
0 c 


14.29. Obtenha a decomposição polar da matriz 

~ y/l 1 1 ' 

-y/2 1 1 ■ 

0 1 -1 












15 


Operadores Normais 
(Caso Real) 


Estudaremos agora o tipo mais geral de operadores (num espaço ve¬ 
torial de dimensão finita, munido de produto interno) para os quais 
vale um resultado análogo ao do Teorema 14.3, ou seja: existe uma 
base ortonormal na qual a matriz do operador começa na forma di¬ 
agonal, seguida por uma série de blocos 2x2 da forma 

o: (3 
—(3 oi 

Eles são os operadores normais. Na Seção 21 veremos que, nos espa¬ 
ços vetoriais complexos, os operadores normais são precisamente 
aqueles que admitem uma base ortonormal de autovetores. 

Nesta seção, todos os espaços vetoriais têm dimensão finita e são 
munidos de produto interno. 

Um operador linear A: E —> E chama-se normal quando comuta 
com seu adjunto, isto é, quando AA* = A*A. 

Uma matriz quadrada a diz-se normal quando comuta com sua 
transposta, isto é, quando aa T = a r a. Portanto um operador é nor¬ 
mal se, e somente se, sua matriz relativamente a uma base ortonor¬ 
mal é uma matriz normal. 




190 Operadores Normais (Caso Real) 


Seção 15 


Exemplo 15.1. Os operadores auto-adjuntos e os ortogonais são 
normais. Analogamente, as matrizes simétricas e as ortogonais qua¬ 
dradas são normais. 


Exemplo 15.2. (Matrizes normais 2 x 2.) Seja a 
matriz normal 2x2. Temos 


a 

b 


c 

d 


uma 


ab + cd 
b 2 + d 2 

ac + bd 
c 2 + d 2 

Logo a é normal se, e somente se, b 2 = c 2 (isto é, b = ±c) e ab + 
cd = ac + bd. Se b = c, a matriz a é simétrica. Caso contrário, 
temos c = —b (com b / 0). Então, de ab + cd = ac + bd resulta 
b(a — d) = b(d — a), donde a = d. Portanto, as únicas matrizes 
normais 2x2 são as simétricas e as da forma 


aa 


a 2 + c 2 
ab + cd 


a T a 


a 2 + b 2 
ac + bd 


a —b 


Observe que se a / 0 então 0 / r = Va 2 + b 2 . Logo existe 0 e R tal 
que cos 0 = a/r e sen 0 = b/r. Então a matriz a se escreve como 


a = r 


COS 0 
sen0 


— sen0 
cos 0 


Isto nos permite concluir que uma matriz normal 2 x 2 ou é simétrica 
ou é a matriz de uma semelhança no plano. 

Um operador linear A: E —> L chama-se anti-simétrico quando 
A* = —A, ou seja, (Au,v) = —(u, Av) para u,v € E quaisquer. Para 
que A seja anti-simétrico é necessário e suficiente que sua matriz 
[aq] em relação a uma base ortornormal de E seja anti-simétrica, isto 
é, aq = — aq para quaisquer i, j = 1,2,..., n. Em particular, a ü = 0. 
Num espaço de dimensão 1, todo operador anti-simétrico é igual a 
zero; logo o único autovalor possível de um operador anti-simétrico 
é 0. 

Evidentemente, todo operador anti-simétrico é normal. 
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Teorema 15.1. Seja A: E —> E um operador normal. Existe uma 
base ortonormal de E na qual a matriz de A tem a forma 


A, 


Ar 

— ( 31 

Pi «t 

a s Ps 
Ps «s 

onde os elementos não expostos são iguais a zero. 

Demonstração: Sejam Og, cr|,..., cr£ os autovalores distintos do 
operador não-negativo A A* = A* A: E —> E, com ao = 0 e oi > 0 
se i > 1. Para cada í = 0,1,..., k, seja Ei = Af(AA* — a?I) o auto- 
subespaço correspondente ao autovalor of. O Teorema Espectral 
nos afirma que E = Eo © Ei © • • • © Ek. Além disso, se u € Ei e 
v € Ej com i 7 ^ j então (u,v) = 0. Da igualdade AA* = A*A re¬ 
sulta imediatamente que cada subespaço Ej é invariante por A e por 
A*. Ora, por definição, A A* em E t coincide com a^I. Logo o ope¬ 
rador Bí: Et —> Ei, definido para i = 1,2,..., k por BiV = (1 /oí)Av, 
é ortogonal. Tomemos em E 0 uma base ortonormal qualquer. (Ob¬ 
serve que Eo = N{AA*) = Aí [A] = Af[A*).) Tomemos ainda, em 
cada subespaço Ei (i — 1,..., k) uma base ortonormal na qual a ma¬ 
triz do operador Bi tenha a forma dada no Teorema 14.3. Juntando 
todas essas bases e ordenando seus elementos na forma adequada, 
obtemos uma base de E na qual a matriz do operador A é do tipo 
desejado. 

Observações: 

1. Os números Ai,.. .,A r são os autovalores de A. Dentre eles, os 
não-nulos têm a forma Ai = ©a,, onde Oj é um valor singular de A. 

Os demais valores singulares de A são aj = J + p? (j = 1,..., s). 

2. Se A não possui autovetores, a matriz do Teorema 15.1 não apre¬ 
senta a parte superior (diagonal). Por outro lado, se A é auto-adjunto 
não existem os blocos 2 x 2 da parte inferior. 
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Corolário. Seja A: E —> E um operador anti-simétrico. Existe uma 
base ortonormal de E relativamente à qual a matriz de A tem a forma 

fO 1 


0 -Pi 
01 0 


0 -0s 

Ps 0 . 

Segue-se imediatamente que o posto de um operador anti-simé- 
trico é um número par. 

Exemplo 15.4. Seja A: M 3 —> K 3 um operador anti-simétrico. Pelo 
corolário acima, existe uma base ortonormal {ui, U 2 , U 3 } c M 3 tal que 
Aui = 0, Au 2 = — |3u 3 e Au 3 = (3u 2 . Em termos do produto vetorial 
clássico de R 3 , podemos escolher 0 sinal de ui de modo que se tenha 
ui x u 2 = u 3 e u 3 x ui = u 2 . Então, se pusermos w = (3ui , teremos 
0 = Aui = ui x w, Au 2 = —(3u 3 = |3(u 2 x ui) = u 2 x w e Au 3 = 
(3u 2 = (3(u 3 xu|)=u 3 xw. Assim, A coincide com 0 operador linear 
v 1 —» v x w nos vetores básicos ui, u 2 , u 3 . Concluímos que, para todo 
v G R 3 , vale Av = v x w. Em resumo: todo operador anti-simétrico 
no espaço R 3 consiste no produto vetorial por um vetor fixo wéI 3 . 


Exercícios 

15.1. Seja A = B + C a decomposição do operador A como soma do 
operador auto-adjunto B com 0 operador anti-simétrico C. Prove que 
A é normal se, e somente se, BC = CB. 

15.2. Prove que os operadores auto-adjuntos S, T: E —> E são iguais 
se, e somente se, (Sv,v) = (Tv,v) para todo v € E. Use este fato para 
provar que A: E —> E é normal se, e somente se, |Av| = |A*v| para 
todo v e E. 

15.3. Se dim E = n e 0 operador normal A: E —> E tem n autovalores 
distintos, prove que A é auto-adjunto. 
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15.4. Sejam ui,..., u n as linhas e vi,..., v n as colunas de uma ma¬ 
triz a. Prove que (ui,Uj) = (vi,Vj) para quaisquer i, j a é normal. 

15.5. Prove que uma projeção P: E —> E é um operador normal se, e 
somente se, P = P*. Resultado análogo para uma involução. 

15.6. Seja A: E —> E um operador normal. Prove que Aí [A] = Aí [A*] 
e conclua que Aí [A) 1 - = Im(A) = Im(A*). 

15.7. Entre as matrizes abaixo, determine quais são normais. 


'9 -3 -6' 


'1 2 3' 


O 

O 

3 9 6 

b = 

3 2 2 

c = 

0-12 

6-6 9 


2 3 5 


-1 

T 

<N 

1 

O 


15.8. Sejam A,B: E —> E operadores normais. Supondo AB = 0, 
prove: 

(a) A imagem de B está contida no núcleo de A; 

(b ) A imagem de B* está contida no núcleo de A*; 

(c) A imagem de A está contida no núcleo de B. 

Conclua então que BA = 0. 

15.9. Se A, B: E —> E são normais e AB = BA, prove que AB é normal. 

15.10. Dê exemplos de operadores normais A, B tais que A + B não 
é normal e AB não é normal. Dê também um exemplo em que AB é 
normal mas AB / BA. 

15.11. Seja A: E —> E um operador linear no espaço E, de dimensão 
finita, com produto interno. Supondo I + A e I — A invertíveis, defina 
S = (I + A)(I — A) -1 . Prove que S é ortogonal se, e somente se, A é 
anti-simétrico. 

15.12. Seja o operador A: M 3 —> M 3 dado por A(x,y,z) = (y +2z, —x + 
3z, —2x — 3y). Escreva sua matriz na base canônica e veja que A é 
anti-simétrico. Por escalonamento, ache um vetor u e ! 3 que é uma 
base de Aí[A). Obtenha ainda uma base {v, w} c Aí [A] 1 - e escreva a 
matriz de A na base {u, v, w} c M 3 . 
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15.13. Seja A: M 4 —> M 4 o operador linear definido por 


A(x,y,z, t) = (y — z + 1 , —x — z + 2t,x + y — t, —x —2y +z). 


Mostre que A é anti-simétrico. Ache bases ortonormais 
{u,v} C J\T[A) e {u',v'} c A/^A) 2 -. Determine a matriz de A na base 
{u,v,u',v'} C M 4 . 


15.14. Se o operador A: E —> E é anti-simétrico, prove que todo vetor 
v e E é perpendicular à sua imagem Av. Se E = M 2 , prove que A é 
um múltiplo ixR da rotação de 90° R: R 2 —> M 2 . 


15.15. Seja 



c —b 

0 a 

—a 0 


a matriz do operador A: M 3 —> M 3 . Mostre que, para todo v € M 3 
tem-se Av = v x w, onde w = (a, b, c). 

15.16. Seja A: E —> E um operador normal. Se Au = Au e Av = yv 
com À / (x, prove que (u, v) = 0. 

15.17. Sejam u 1? ...,u n os vetores-linha e vi, ...,v n os vetores-coluna 

SL b 

da matriz , onde a e M(p x p). Se |ut| = |vt| para i = 1,... ,u, 

u c 

prove que b = 0 e M(p x (n — p)). 


15.18. Se um subespaço E c E é invariante pelo operador normal 
A: E —> E, prove que E também é invariante por A* e que o comple¬ 
mento ortogonal E 2 - é ainda invariante por A e A*. 


15.19. Seja E c E um subespaço invariante pelo operador normal 
A: E —* E. Prove que a restrição de A ao subespaço E é ainda um 
operador normal. 
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A noção de pseudo-inversa e o estudo de suas propriedades consti¬ 
tuem uma maneira simples e atraente de aplicar alguns dos resul¬ 
tados obtidos nas seções anteriores. Do ponto de vista prático, esta 
noção responde uma pergunta bastante natural, que ocorre de fato 
em diferentes aplicações da Álgebra Linear: dada A e £(E;F) e dado 
b e F , se é impossível achar xeE tal que Ax = b, qual é, ou melhor, 
quais são os vetores x e E tais que o erro |Ax — b| é o menor possível 
e qual entre esses vetores x é a solução ótima, ou seja, tem a menor 
norma? 

Sabemos que um sistema de m equações lineares com n incógni¬ 
tas pode ser interpretado como o problema de achar um vetor xel n 
tal que Ax = b, onde A: M n —> R m é a transformação linear cuja 
matriz (nas bases canônicas de M n e R m ) é dada pelos coeficientes do 
sistema e b € M m é o vetor cujas coordenadas são os números que 
figuram nos segundos membros das equações do sistema. 

Se b não pertence à imagem de A, o sistema Ax = b evidente¬ 
mente não possui solução. Faz sentido, entretanto, procurar em M n 
um vetor x tal que Ax esteja o mais próximo possível de b e, dentre 
esses vetores x, aquele de menor norma. Isto nos leva à noção de 
pseudo-inversa de uma transformação linear. 

Seja A: E —» F uma transformação linear entre espaços vetoriais 
de dimensão finita, munidos de produto interno. A pseudo-inversa 
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de A é a correspondência A + : F —> E que associa a cada y € F o 
vetor A + y = x G E de menor norma entre todos os vetores x£ E que 
tornam mínima a distância |y — Ax|. (Fig. 16.1.) 




Figura 16.1. 


Descrevamos como opera a pseudo-inversa A + : F —> E. Dado 
y € F, o vetor de Im(A) mais próximo de y é a projeção ortogonal 
y 0 de y sobre Im(A), caracterizada pelo fato de que y 0 G Im(A) 
e y — y 0 é perpendicular a (todos os vetores de) lm(A), ou seja, 
y — y 0 € Aí [A*). Como y 0 € Zm(A), existem vetores x € E tais 
que Ax = y 0 . Se x é um deles, os demais são da forma x + z, onde 
z € Aí [A], pelo Teorema 6.4. Dentre estes vetores x + z, o de me¬ 
nor norma é x — x 0 , onde x 0 é a projeção ortogonal de x sobre Aí [A] 
pois sendo x — x 0 perpendicular a Aí [A], Pitágoras nos dá, para todo 
z <E Aí[A): 

|x + z | 2 = |x — x 0 + z + x 0 | 2 = |x — x 0 | 2 + |z + x 0 | 2 > |x — x 0 | 2 . 

(pois z + x 0 G Aí [A), logo é perpendicular a x — x 0 ). Portanto A+y = 
x — x 0 . Note que, sendo ortogonal a Aí [A), A + y pertence a Zm(A*). 
Na realidade, A + y é o único vetor da imagem de A* tal que AA + y = 
y 0 . (Com efeito, A, restrita a Im(A*), é injetiva, visto que Im(A*) n 
AA(A)={0}.) 

Esta definição da pseudo-inversa de uma transformação linear 
A: E —» E apresenta-a como uma função bem definida A + : F —> E, 
com as propriedades geométricas procuradas, porém não deixa claro 
se A + é uma transformação linear. Usando o Teorema 13.10, apre¬ 
sentaremos em seguida uma transformação A': F —> E, que certa¬ 
mente é linear mas que usa certas bases escolhidas em E e F, de 
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modo que não parece estar bem definida. Em seguida, provaremos 
que A' = A + , logo A + é linear e A' não depende das escolhas de 
bases. 

Seja r o posto da transformação linear A: F —> F. Pelo Teorema 
13.10, existem bases ortonormais (ui,..., u n } c E, {vi,..., v m } c F e 
números positivos ui,..., oy tais que Au* = 0 "^, A*vi = OíUí para 
1 <i<re Auí = 0, A*v^ = 0 para i > r. Pelo Teorema 4.1, existe 
uma única transformação linear A': F —> F tal que 

A'v| = — Ui para 1 < i < r e A'vt = 0 quando i > r. 

Teorema 16.1. A' = A + = pseudo-inversa de A. 

Demonstração: Devemos mostrar que, para todo y e F, o vetor A'y 
é igual a A + y, isto é, tem as seguintes propriedades: (1) AA'y = y 0 
é o vetor de Im(A) mais próximo de y; (2) A'y é o vetor de menor 
norma em F cuja imagem por A é y Q . Estas afirmações são equiva¬ 
lentes a (V) (y — AA'y) _L Im(A), ou seja, y — AA'y € N{A*), ou 
ainda, A*y = A*AA'y; (2') A'y € Im(A*). Evidentemente, basta ve¬ 
rificar a validez de (V) e (2') quando y é qualquer um dos vetores 
básicos vi,... ,v m . Nestes casos, porém, (V) e (2') resultam imedia¬ 
tamente da definição de A'. I 

Corolário 1. AA + : F —> F é a projeção ortogonal sobre Im(A) e 
A+A: F -) F é a projeção ortogonal sobre Zm(A*). 

Com efeito, temos AA'ví = vt se 1 < i < r, A'ví = 0 se 
i > r, A' = A + e {vi,...,v T } C Zm(A) é uma base. Analogamente 
para A + A. (O Corolário 1 também resulta diretamente da definição 
de A+.) OI 

Corolário 2. Se A: F — > F é injetiva então A + = (A^A )^ 1 A*. 

Com efeito, se A é injetiva, o operador A*A: F —> F é invertível. 
(Corolário do Teorema 13.9). A igualdade alegada significa que 
A*(AA + ) = A*, o que foi estabelecido na prova do Teorema 16.1. 
(Forma final da condição (!').) □ 

Corolário 3. Se A: F —> F é sobrejetiva então A + = A*(AA*)“ 1 . 

Com efeito, ainda pelo Corolário do Teorema 13.9, A sobrejetiva 
implica que o operador AA*: F —» F é invertível e a igualdade alegada 
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equivale a (A + A)A* = A*. Isto é evidente se substituirmos A + por 
A' (vide prova do Teorema 16.1) e testarmos a igualdade em cada 
um dos vetores da base (vi,..., v m ) c F. □ 

Corolário 4. Se A: F —> F é invertível então A + = A -1 . 

Evidente. □ 

Segue-se dos Corolários 2 e 3 que se A é injetiva então A + é uma 
inversa à esquerda de A, e se A é sobrejetiva então A + é uma inversa 
à direita de A. 

Corolário 5. Para toda transformação linear A: E —> F, tem-se 

(A*) + = (A + )*: E -» F. 

Com efeito, as bases ortonormais fornecidas pelo Teorema 13.10 
e usadas na definição de A' tanto servem para A como para A*. Se 
as utilizarmos com A* em vez de A, obteremos (A*)'ui = (1 /(q)vi se 
1 < i < r e (A*)'uí = 0 se i > r + 1. Mas é claro que (A 7 )* opera 
do mesmo modo sobre os vetores básicos iq. Logo (A 7 )* = (A*) 7 e daí 
segue o corolário. □ 

Exemplo 16.1. Se A: E —> E é ortogonal então é injetiva, logo 
A + = (A*A) -1 A*. Mas a ortogonalidade de A significa A*A = L, 
logo A + = A*. 

Exemplo 16.2. Seja A: R 2 M 3 dada por A(x,y) = (x,y,0). Como 
A é ortogonal, temos A + = A*. A matriz de A tem colunas (1,0,0) e 
(0,1,0), logo estas são as linhas da matriz de A*, portanto A*(x,y,z) 
= (x,y). Portanto a pseudo-inversa de A é A + : M 3 —> M 2 , dada por 
A + (x,y,z) = (x, y). 

Exemplo 16.3. Definamos A: M 2 —> M 3 pondo A(x,y) = (x,y,x + 
y). Como A é injetiva, sua pseudo-inversa é A + = (A*A) _1 A*. As 
colunas da matriz de A (linhas da matriz de A*) são (1,0,1) e (0,1,1), 
logo 

A*(x,y,z) = (x + z,y +z) 

e daí 

A*A(x,y) = (2x + y,x + 2y). 

Para determinar (A*A)~ 1 (x,y) = (s,t), resolvemos o sistema 
(A*A)(s, t) = (x,y), ou seja 2s+t = x, s+2t = y, no qual as incógnitas 
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são s, t. Encontramos 

_ (2x-y) [2y- x) 

S ~~ 3 6 ~~ 3 

Portanto 

(A*A) -1 (x,y) = ^ (2x — y,2y—x). 

Assim, para qualquer (x,y,z) € R 3 temos 

A + (x,y,z) = [(A* A) -1 A*](x,y,z) 

= (A*A)^ (x + z,y +z) 

= ^( 2x ~y + z ’ 2 y - x + z). 

Exemplo 16.4. Seja B : R 3 —> R 2 dada por 

B(x,y,z) = ^(2x-y +z,-x + 2y +z). 
Temos as matrizes de posto 2: 


b = \ 

' 2 

-i r 

, T 1 

e b = - 

' 2 

-1 

-T 

2 

3 

-1 

2 1 

3 

1 

1 


Logo B é sobrejetiva e B + = B*(BB*) 1 . Como a matriz de B* é b T , 
temos 

B*(x,y) = -( 2 x-y,-x + 2 y,x + y) 
para qualquer (x,y) € R 2 . Segue-se que BB*: R 2 —> R 2 é dado por 

BB*(x,y) = B (2x — y, —x + 2y, x + y) 

= ^( 6 x — 3y, —3x + 6 y) 

= ^ ( 2 x — y, —x + 2 y). 

Para determinar (BB *) -1 (x,y) = (s,t), resolvemos o sistema 

BB*(s,t) = (x,y), isto é, 2s — t = 3x, — s + 2t = 3y, nas incógnitas 
s, t, e encontramos s= 2 x + y,t = x + 2 y, portanto 

(BB *) -1 (x,y) = (2x + y,x + 2y). 
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Isto nos dá, finalmente: 


B + (x,-y) = B*(BB*)- 1 (x,y) 

= B*(2x + y,x + 2y) 

= ^ (3x, 3y, 3x + 3p), 


ou seja, B + (x,y) = (x,y,x + y). 

Retomando a transformação A do Exemplo 16.3, vemos que B = A + 
e constatamos que (A + ) + = B + = A. 

A relação A ++ = A, verificada no caso particular acima, é verda¬ 
deira em geral. Isto pode ser visto facilmente examinando a defini¬ 
ção da transformação A' e notando que (A')' = A. Como A' = A + , o 
resultado segue daí. 


Exercícios 

16.1. Determine a pseudo-inversa de cada uma das seguintes trans¬ 
formações lineares: 

(a) A transformação nula 0: E —> E; 

(b) A projeção ortogonal P: E —> E sobre o subespaço F; 

(c) A mesma projeção acima, considerada como transformação li¬ 
near de E sobre E; 

(d) A projeção (não-ortogonal) P: M 2 —> M 2 , sobre a reta F, parale¬ 
lamente à reta G. (Descreva P + geometricamente.) 

16.2. Para toda transformação linear A: E —> E e todo <x / 0, prove 
que (a • A) + = ^ • A + . 

16.3. Identifique o núcleo e a imagem da pseudo-inversa de uma 
transformação linear A: E —> E. 

16.4. Dada a transformação linear A: E —> E, prove que, para todo 
weE, tem-se A + AA*w = A*w. 
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16.5. Sejam A:E —> F e B: F —> G transformações lineares. Se 
Im(A) = Im(B*), prove que (BA) + = A + B + . 

16.6. Dado o operador A: E — > E, prove: 

(a) Se A é auto-adjunto, A + também é. 

(b) Se A é normal, A + também é. 

(c) Se A é não-negativo, A + também é. 


16.7. Dados os vetores linearmente independentes vi,... ,v r e R n , 
seja a e M(n x r) a matriz que os tem como colunas. Prove que a 
projeção ortogonal de um vetor qualquer x € R n sobre o subespaço 
gerado por vi,..., v T é Px = a(a T a )^ 1 a T x, onde identificamos o vetor 
xel n com a matriz xe M(u x 1) cuja única coluna é x. 

16.8. Use a fórmula acima para determinar a projeção ortogonal do 
vetor ( 1 , 2 ,3) sobre o plano gerado pelos vetores (1,1,1) e (1, —1,1). 

16.9. Seja A: R n — > R m uma transformação linear. Prove que, dado 
qualquer b € R m , a equação A*Ax = A*b sempre possui solução. 
(Uma infinidade delas se A* A não é invertível.) 

16.10. Prove as seguintes propriedades da pseudo-inversa de uma 
transformação linear A: E —> E: 


(a) AA+A = A 

(b) A+AA+ = A+ 

(c) (AA+)* = AA+ 

(d) (A+A)* = A+A. 

16.11. Seja A: R 2 — > R 3 dada por A(x,y) = (x,y,2x + 3q). Determine 
a pseudo-inversa A + : R 3 —> M 2 . 

16.12. Ache a pseudo-inversa da transformação linear A: R 3 — > R 2 , 
sabendo que A(x,q,z) = (x + q,y + z). 
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16.13. Determine a pseudo-inversa de uma matriz diagonal d = 
[dtj] € M(u x n). (Isto significa, naturalmente, a matriz de D + , 
onde D: R n —> R n é o operador linear cuja matriz na base canônica 
é d.) Considere explicitamente o caso em que a diagonal de d é 

(1,0,-2,0,1/3). 

16.14. Dada a transformação linear (não necessariamente injetiva) 
A: E —> E, sejam P: E —! E e Q: F -> F as projeções ortogonais sobre 
Im(A*) e Im(A) respectivamente. Interprete e demonstre a igual¬ 
dade A + = PA -1 Q. 

16.15. Defina o operador A: R 2 —> R 2 pondo A(x,y) = (x — y,x — y). 
Determine a matriz de A + : R 2 —> R 2 na base canônica. Ache o vetor 
v € R 2 de menor norma tal que Av está o mais próximo possível de 

w = (3,5). 

16.16. Dado o vetor não-nulo a e E, defina a transformação linear 
A: R —> E pondo A • 1 = a. Mostre que A*: E —> R é definida por 
A* • w = (a,w) e, usando a expressão A + = (A*A) _1 A*, conclua que 
A + : E —> R é dada por A + • w = (a, w) /|a| 2 . 

16.17. Fixado o vetor não-nulo b e E, defina B: E —> R pondo B • w = 
(b,w). Mostre que B + = B*(BB*) -1 para concluir que B + : R —> E 
cumpre B + • 1 = b/|b| 2 . 

16.18. Sejam A:R—) E e B: E ->R definidas por A • 1 = a, B • w = 
(b,w), onde a,b e E são vetores fixados de tal modo que (a, b) / 0. 
Prove que as transformações lineares (BA) + : R —> R e A + B + : R —> R 
são dadas por 


(BA)+ • 1 = e (A+B+) • 1 

(a,b) 


(a> b ) 
|a | 2 • |b| 2 ' 


Conclua que, em geral, se tem (BA) + / A + B + . Dê um exemplo con¬ 
creto desta desigualdade, com A:R^R 2 eB:l 2 -)R. 

16.19. Com a notação dos dois exercícios anteriores, prove que 

(AB)+ = B+A+. 
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16.20. Seja A: E —> F a transformação linear de posto 1 dada por 
Av = (v, a) b, onde a € E e b € F são vetores / 0. Sabendo que 
A*w = (w, b) a para todo w € F (cfr. Exercício 11.17), mostre que 


A + w 


(w,b) _ 
|a| 2 |b| 2 


para todo w € F. 

16.21. Sejam A: M m —> R n sobrejetiva e B: l n -t M m injetiva. Prove 
que (BA) + = A + B + . (Generalização do Exercício 16.19.) 

16.22. Prove que a projeção P: F —> E é ortogonal se, e somente se, 
P+ - P. 

16.23. Use o Exercício 16.20 para calcular a pseudo-inversa da 
transformação linear A: M 2 —> M 3 que tem a matriz 


'1 

4 

1 


3' 

12 

3 


16.24. Sejam vi,V 2 ,v 3 ,V 4 ,vs € M 4 as colunas de uma matriz [ay] € 
M(4 x 5). Suponha que vi e V 2 sejam L.I. e que v 3 = b 13 vi + b 2 3 V 2 , 
V 4 = b^vi + b24V2, V 5 = bisvi + b25V2. Prove que 


CMi 

012 

013 

014 

O15" 


"ou 

O12' 






0-21 

022 

023 

024 

025 


021 

022 


1 

0 

bi3 

bi4 

bi5 

<131 

032 

033 

O34 

035 


031 

O32 


0 

1 

b23 

b 2 4 

b25_ 

041 

042 

O43 

044 

045. 


.041 

042. 







Mostre que este é um método geral para exprimir toda matriz m x n 
de posto r como produto de uma matriz m x r por uma matriz r x n, 
ambas de posto (máximo) igual a r. Compare com o Exercício 6.29, 
do qual esta é uma versão matricial. Mostre que as matrizes 4 x 
2 e 2 x 5 acima foram obtidas a partir da solução natural daquele 
exercício. Deduza daí (com auxílio do Exercício 16.21) um processo 
para calcular a pseudo-inversa de qualquer matriz. 
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Salvo o item Cea observação final do item G, os assuntos tratados 
nesta seção não serão necessários para entender as seguintes. Alguns 
deles são traduções, para a linguagem das matrizes, de teoremas e 
métodos apresentados nas seções precedentes, outros são tópicos ma¬ 
triciais interessantes em si mesmos ou temas clássicos do cálculo ma¬ 
tricial que se têm revelado úteis, especialmente sob o ponto de vista 
computacional. 


17.A Matrizes de Gram 

Seja E um espaço vetorial de dimensão finita, munido de produto 
interno. A matriz de Gram dos vetores vi, ..., G E é a matriz 
g = [gtj] G M(kxk),onde gij = (vyVj). Quando precisarmos ser mais 
explícitos, escreveremos g = g(vi,..., v k ). 

Dada uma base U = {ui,..., u n } c E, seja a = [ay] G M(u x k) a 
matriz das coordenadas dos vetores Vj em relação à base U, isto é: 

vj = aijU] H-1-a n ju n para j = 1 ,...,k. 

Seja ainda h = [hy] G M(n x n) a matriz de Gram da base U, isto é, 
hy = (uyuj). Então, para i,j = 1,... ,k, temos (escrevendo my para 
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indicar o ij-ésimo elemento de uma matriz m): 


9ij = = 




^(a T ) ÍT (ha) rj = (a T ha)y 


r=1 


n 


portanto g = a T ha. 

Em particular, se tomarmos uma base ortonormal {ui,..., u n } c 
E, teremos h = I n , portanto a matriz de Gram g se escreve como 


g = g(vi,...,v k ) = a r • a, 


onde a é a matriz das coordenadas dos vetores Vj em relação a uma 
base ortonormal de E. Daí resultam: 

1) Toda matriz de Gram é não-negativa; 

2) A matriz de Gram g = g(vi,..., v k ) é positiva (isto é, invertível) se, 
e somente se, os vetores vi,..., v k são L.I.. 

Reciprocamente, se uma matriz g = [gy] £ M(k x k) admite uma 
decomposição do tipo g = a T a, onde a = [ay] G M(n x k) então, 
tomando uma base ortonormal {ui,..., u n } cEe escrevendo 


n 



i=1 


obtemos vetores vi,..., v k G E tais que 


n 


( v i,Vj) = Y_ a kí a kj = (a T • a)ij = gtj, 


logo g = g(vi,..., v k ) é a matriz de Gram dos vetores vi,..., v k . Isto 
leva a mais uma propriedade das matrizes de Gram: 

3) Toda matriz não-negativa g = [gy] € M(k x k ) é a matriz de Gram 
de uma lista de vetores vi,..., v k G E. 

Com efeito, existe a G M(kx k) simétrica (e não-negativa) tal que 
g = a 2 = a T • a (Teorema 13.8). 
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17.B Matrizes Triangulares 

Uma matriz t = [tq] € M(n x n) diz-se triangular superior quando 
tq = 0 para i > j e triangular inferior quando tq = 0 para i < j. 

Trataremos primordialmente de matrizes triangulares superio¬ 
res. As propriedades das triangulares inferiores são análogas e se 
provam analogamente. 

Uma matriz triangular superior é a matriz de um operador linear 
T: R n —> M n tal que (eqTej) = 0 para i > j. Se chamarmos de Fi c 
M n o subespaço vetorial formado pelos vetores (xi,..., xq..., 0) cujas 
últimas n — i coordenadas são nulas, a matriz do operador T: R n —> 
M n (na base canônica) é triangular superior se, e somente se, todos 
os subespaços F 0 c • • • C F n são invariantes por T. 

Com efeito, a condição (et, Te,) = 0 para i > j significa que, para 
cada j, as últimas n — j coordenadas do vetor Te^ são nulas, ou seja, 
que Te, G Fj para j = 1,..., n. Isto é o mesmo que dizer que T(Fj) C Fj 
para todo j. 

Seguem-se algumas propriedades das matrizes triangulares su¬ 
periores: 

1 ) O produto de duas matrizes triangulares superiores é ainda uma 
matriz triangular superior. 

Com efeito, se o subespaço Ft c M n é invariante por cada um dos 
operadores S, T: R n —> M n então Fi é invariante pelo produto ST. 

2) Uma matriz triangular superior t = [tq] é invertível se, e somente 
se, os elementos tu da sua diagonal são todos diferentes de zero. No 
caso afirmativo, a inversa t 1 é triangular superior e os elementos de 
sua diagonal são t. 

Com efeito, se todos os t ü são / 0, dado um vetor não-nulo v € Re¬ 
provemos que Tv / 0 (onde T é o operador de M n cuja matriz na base 

canônica é t). Seja v = xieH-Fx T e T , com x T / 0. Como (e T , Te*) = 0 

para i < r, temos 



i<r 


portanto (e r , Tv) / 0, e daí Tv / 0. Assim t é invertível. 

Reciprocamente, se t (ou seja, T) é invertível então, para cada 
i = 1,..., n, a restrição T: Fi —> Fi, de T ao subespaço Fi, é também 
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invertível, logo sobrejetiva. Se fosse tu = (e^Tei) = 0, teríamos, 

como acabamos de ver, para todo v = xi ei -\ -+ x^ € Tü, (ei, Tv) = 

Xitu = 0, logo Tv € Fí_i . Isto significa que T(Ft) C Fi_i, contradizendo 
a sobrejetividade de T: F* —> Fu Portanto todos os tu são diferentes 
de zero. 

Se a matriz triangular superior t é invertível, o operador linear 
T: M n —> M n também é. Cada um dos subespaços F* = S(ei,..., e-j.) C 
M n sendo invariante por T é também invariante por T^ 1 . (Com efeito, 
A(F) C F =^> A(F) = F => A -1 (F) = F.) Logo a matriz t _1 , do 
operador T -1 , é também triangular superior. Escrevendo tr 1 = [sy], 
a igualdade trA = I n nos dá, para cada i = 1 ,..., n: 

n 

1 = (t t)u = y Si k tki = Sutu, 
k=l 

pois stk = 0 se i > k e t kí = 0 se k > i. Logo sy = 1 Au. 

3) Os autovalores de uma matriz triangular superior t = [ty] e 
M(n x n) são os elementos tu da sua diagonal. 

Por definição, os autovalores de t são aqueles do operador 
T: M n —> M n cuja matriz na base canônica é t. 

Em primeiro lugar, se À é um autovalor de t, isto é, se existe 
u / 0 em M n tal que Tv = À • v, seja v = xi e-\ + • • • + x T e T , com x T / 0. 
Então, como (e T , Te*) = 0 se í < r, temos 

Ax t = (e T ,Àv) = (e r ,Tv) 

= (e r ,xiTei H-hx T Te r ) 

= (e r ,x r Te T ) = t TT x r . 

Segue-se que À = t rT . Assim, somente os números tu podem ser 
autovalores de T. 

Em segundo lugar, todos os t ü são, de fato, autovalores de t. Com 
efeito, a matriz t — tyl n é triangular superior e o i-ésimo elemento 
de sua diagonal é zero, logo não é invertível. Conseqüentemente, tu 
é um autovalor de t. 

4) Seja U — {ui,..., u n } c T uma base ortonormal, obtida pelo pro¬ 
cesso de Gram-Schmidt a partir da base V = {vi,..., v n } C E. A 
matriz de passagem de V para U é triangular superior e seus autova¬ 
lores são todos positivos. 
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Com efeito, escrevendo 


n 


Uj = Y- Po v ú 


sabemos que cada Uj pertence ao subespaço vetorial gerado por 
vi,..., Vj, logo Uj = pijVi + • • • + PjjVj. Isto mostra que a matriz de 
passagem p = [py] e M(n x n) é triangular superior. Além disso, 
como Uj = |wj| -1 Wj, onde o vetor Wj tem a forma 



vemos que pjj = |wj| 1 é positivo, para cada j = 1,..., u. Como vimos 
acima, esses números pjj são os autovalores da matriz p. 

17.C Decomposição de Cholesky 

Mostraremos que toda matriz positiva a = [ay] e M(n x n) pode ser 
expressa como o produto a = t T • t, onde teM(nxn)é uma matriz 
triangular superior cujos elementos da diagonal são todos positivos. 
A expressão a = t T • t chama-se a decomposição de Cholesky da ma¬ 


triz a. 


Mais adiante (17.G) daremos outra prova da existência da de¬ 
composição de Cholesky, por um método que permite obter a matriz 
t por escalonamento a partir de a. 

Agora, demonstraremos a possibilidade da decomposição a = t T t 
usando Gram-Schmidt e a existência da raiz quadrada de a quando 
a > 0 (isto é, quando a é positiva). 

Como vimos acima (17.A) existem vetores vi,...,v n € M n tais 
que ay = (vt,Vj), ou seja, a = g(vi,... ,v n ) é a matriz de Gram dos 
vetores vi,..., v n , os quais formam uma base de M n , pois a > 0. 

Pelo processo de Gram-Schmidt, obtemos uma base ortonormal 
{ui,..., u n } c M n a partir de vi,..., v n . Para i, j = 1,..., n, temos 



r 


onde a matriz de passagem p=[py] é triangular superior, com pu >0 
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para todo i. (17.B.) Usando o símbolo de Kronecker 5q, temos 

n n 

óij = (Ui,Uj) = Y_ PriPsj (v T ,V s ) = Pri^rsPsj , 

r,s=1 r,s=1 

logo p T ap = I n . Pondo t = p 1 , obtemos a = t T • t. 

A decomposição de Cholesky é única. Noutras palavras, se s e t 
são matrizes triangulares superiores n x n com diagonais positivas 
e s T • s = t T • t então s = t. 

Com efeito, de s T .s = t T .t resulta sU 1 = (s T ) -1 .t T . Como o pri¬ 
meiro membro desta última igualdade é uma matriz triangular su¬ 
perior e o segundo é triangular inferior, concluímos que d = st 1 = 
(sV.t T é uma matriz diagonal, com du > 0 (e dq = 0 se i / j). 
Segue-se imediatamente das igualdades acima que s = dt e t = ds. 
Olhando para os elementos da diagonal, temos su = dutu e t u = 
duSü. Como su > 0 e t ü > 0, isto implica du = 1, logo d = I n e s = t. 


17.D A Decomposição qr 

Esta é uma interpretação matricial do processo de Gram-Schmidt. 
Segundo ela, toda matriz invertível a = [aq] € M(n x n) admite uma 
decomposição do tipo a = qr, onde q é ortogonal e r é triangular 
superior, com elementos positivos na diagonal. 

Para chegar a este resultado, chamemos de vi,..., v n as colunas 
da matriz aedeW = {ui,..., u n } c M n a base ortonormal obtida dos 
ví pelo processo de Gram-Schmidt. Como sabemos, a matriz p = [pq] 
de passagem da base V — (vi,..., v n } para a base U é triangular su¬ 
perior, com elementos positivos na diagonal. Além disso, a matriz 
q = [qq], cujas colunas são os vetores Uj = (qq, qq,..., q n j), é orto¬ 
gonal. 

Tomando a i-ésima coordenada de ambos os membros da igual¬ 
dade vetorial u f = PkjVk, obtemos 

k 


n n 

qq = ^pkjdik = Y_ a ikPkj = (ap)q , 
k=1 k=1 
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para quaisquer í ,) = 1,..., n. Logo q = ap. A matriz r = p 1 é, como 
vimos acima, (17.B), triangular superior com elementos positivos na 
diagonal. De ap = q resulta imediatamente a = qr. 

Observação Dada a matriz invertível a € M(n x n), são únicas as 
matrizes q, r tais que a = qr, q é ortogonal, r é triangular superior 
e os elementos de sua diagonal são positivos. Com efeito, a = qr 
escreve-se também como ap = q, onde p = r 1 . Isto quer dizer que p 
é a matriz de passagem da base V = (vi,..., v n } c M n , formada pelas 
colunas de a, para a base ortonormal U = {u],..., u n } c M n , dada 
pelas colunas de q. Ora, as quatro condições seguintes implicam 
que cada u, é determinado univocamente a partir de vi,..., Vj: 

1 ) Uj =pijVi +p 2 jV 2 H-fPjjVp 

2 ) Uj é ortogonal a vi,..., Vj^i; 

3) |uj | = 1; 

4) pjj > 0. 


Com efeito, 1) diz que Uj pertence ao subespaço FcT gerado por 
vi,...,Vj. 2) diz que Uj pertence a reta R, complemento ortogonal de 
{vi,..., Vj_i} no subespaço F. Já 3) restringe Uj a ser um dos 2 vetores 
unitários da reta R. E, finalmente, 4) diz que u, é o vetor unitário de 
R tal que (uj,Vj) é positivo. 

A condição 1) diz que a matriz p é triangular superior. 2) e 3) di¬ 
zem que a matriz q é ortogonal, enquanto 4) afirma que os elementos 
da diagonal de p são positivos. Juntas, elas garantem a unicidade 
de q e portanto a unicidade de p = a ] q. 

A observação acima estabelece também a unicidade do processo 
de Gram-Schmidt sob a condição de que cada u, pertença ao sub¬ 
espaço gerado por e cumpra (uj,vj) > 0 (além, natural¬ 

mente, de serem ui,..., Uj ortonormais). 

Em resumo: a igualdade a = qr significa que as colunas de q 
formam a base ortonormal de R n obtida das colunas de a por Gram- 
Schmidt e r é a matriz de passagem das colunas de q para as colunas 
de a. 
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17.E Diagonalização, Decomposição Polar e Valores 
Singulares 

O Corolário do Teorema 12.2 e o Teorema Espectral 13.6, quando for¬ 
mulados em termos de matrizes, apresentam as seguintes versões: 

1) Se a matriz quadrada a £ M(n x n) possui n autovalores di¬ 
ferentes então existe uma matriz invertível p £ M(n x n) tal que 
p 1 ap = d é uma matriz diagonal. Os elementos da diagonal de d 
são os autovalores de a. 

2) Se a matriz a € M(n x n) é simétrica então existe uma matriz 
ortogonal q € M(nxn) tal que q T aq = d é uma matriz diagonal. Os 
elementos da diagonal de d são os autovalores de a. 

Já o Teorema 14.4 assume a seguinte forma: 

3) Toda matriz quadrada a € M(nxn)se exprime como produto a = 
pu, onde p £ M(n x n) é uma matriz não-negativa e ué ortogonal. 

Finalmente, o Teorema 13.10 tem a versão matricial abaixo: 

4) Para toda matriz a € Mjm x n) existem matrizes ortogonais p £ 
M(mxm), q £ M(nxn), tais que paq = d, onde d £ M(mxn) é uma 
matriz diagonal, d = [dy], isto é, di, = 0 se i / j. Para i = 1 ,..., r = 
posto de a, tem-se du = cq > 0, o\é um autovalor de a T a (e de aa l e, 
para i > r, du = 0. 

Equivalentemente, podemos escrever a = p T dq T ou, mudando 
de notação, a = pdq. Esta se chama a decomposição de a a valores 
singulares (singular value decomposition), pois os elementos não- 
nulos cq da diagonal de d são os valores singulares de a, ou seja, 
Oi > 0 para todo i = 1 ,..., n e, além disso, 


são autovalores de a T a. 

Se a £ M(4 x 5) e tem posto 3 então a matriz d tem a seguinte 
forma, com Ai > 0 , A 2 > 0 e À 3 > 0 : 


A, 0 0 0 0' 

0 A 2 0 0 0 

0 0 A 3 0 0 

0 0 0 0 0 
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17.F A Decomposição lu 

Cada uma das três operações elementares sobre as linhas de uma 
matriz, introduzidas na Seção 9, pode ser interpretada como a mul¬ 
tiplicação à esquerda por uma matriz invertível de tipo especial, cha¬ 
mada uma matriz elementar. 

Mais precisamente, uma matriz elementar m x m é uma matriz 
que resulta da aplicação de uma operação elementar à matriz iden¬ 
tidade I m . Há portanto 3 tipos de matrizes elementares. Vejamos 
alguns exemplos no caso 4x4: 


0 

0 

1 

0' 


'1 

0 

0 

0' 


'1 

0 

0 

0 ' 

0 

1 

0 

0 


0 

1 

0 

0 


0 

oc 

0 

0 

1 

0 

0 

0 

> 

0 

0 

1 

0 

> 

0 

0 

1 

0 

0 

0 

0 

1 


(X 

0 

0 

1 


0 

0 

0 

1 


As matrizes acima se obtêm a partir de I 4 mediante as operações 
Li <-> L3, L4 + cd-i e cd-2 respectivamente. 

Afirmamos que aplicar uma operação elementar a uma matriz 
com m linhas é 0 mesmo que multiplicá-la à esquerda pela matriz 
que resulta de aplicar a mesma operação às linhas de I m . 

Isto decorre da seguinte observação (cuja verificação deixamos 
a cargo do leitor): se a h a' simboliza uma determinada operação 
elementar sobre matrizes com m linhas então, para toda b e M(m x 
m), tem-se (ba)' = b' • a. Admitido este fato, tomamos m = I' m e 
vemos que, para toda matriz a com m linhas, vale 


a' = (I m a)' = F m a = m a. 


Portanto 0 método de eliminação de Gauss para reduzir uma ma¬ 
triz de m linhas à forma escalonada consiste em multiplicá-la suces¬ 
sivamente à esquerda por matrizes elementares do tipo 1 (transposi¬ 
ção de duas linhas) ou do tipo 2 (subtrair de uma linha um múltiplo 
de outra linha). Uma matriz elementar do tipo 2, que corresponda à 








Seção 17 


Tópicos Matriciais 213 


operação Li — aLj, com j < i, tem a forma abaixo: 
'1 


1 


—<x ... 1 


1 


Os elementos não indicados fora da diagonal são nulos. O número 
—a está na linha i e na coluna j. A fim de tornar igual a zero o 
elemento ay da matriz a = [ay] mediante essa pré-multiplicação, 
deve-se tomar a = ay/ay. O elemento ay, que se supõe / 0, chama- 
se o pivô. Para eliminar (tornar iguais a zero) todos os elementos 
abaixo da diagonal na coluna j da matriz a, deve-se pré-multiplicá-la 
pelo produto das m—j matrizes da forma acima que se obtêm fazendo 
sucessivamente i = j + 1,..., m. Isto equivale a pré-multiplicar pela 
matriz 

n 


mi 


1 

— a j+hj 


(*) 


CXmj • • • 1 

(com os <x’s na j-ésima coluna), onde ay = ay/ay. Por exemplo, se 
m = 4 e j = 1, vemos facilmente que 


1 

0 

0 

0 ' 


1 

0 

0 

0 


1 

0 

0 

0 ' 

-a 2 

1 

0 

0 


0 

1 

0 

0 


0 

1 

0 

0 

0 

0 

1 

0 


-«3 

0 

1 

0 


0 

0 

1 

0 

_ 0 

0 

0 

1 


0 

0 

0 

1 


—a4 

0 

0 

1 


1 0 0 0 ' 

— OÍ2 1 0 0 

— OÍ 3 0 1 0 

— 04 0 0 1 
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Suponhamos que, durante o processo de escalonamento de uma 
dada matriz, nunca haja necessidade de se efetuar transposição de 
linhas. Então podemos assegurar que existem matrizes mi,..., m m 
do tipo (*) acima, tais que 


m, ... m m i a = u, 


onde u é uma matriz escalonada. Se a for uma matriz quadrada, 
u é triangular superior. (Daí a notação: u provém de upper trian¬ 
gular, em inglês.) Se u = [uq] € M(m x n) (além de não requerer 
transposições de linha em seu escalonamento) tem posto máximo (m 
ou n) então o primeiro elemento não-nulo de sua i-ésima linha é uu. 
Portanto, neste caso, os elementos u ü da diagonal de u são os pivôs, 
logo são diferentes de zero. 

Evidentemente, toda matriz elementar é invertível, logo toda 
matriz irij do tipo (*) acima possui uma inversa e é claro que 

1 

1 

a i+i,j 

«mj 1. 

Segue-se então que toda matriz a cujo escalonamento não requer 
transposições de linhas se escreve como 

a = nrf 1 m-l 1 ... m~ u = lu 


_-i 

m 


onde as mj têm a forma (*) e u é escalonada. 

Agora ocorre um fato notável. Embora o produto m m ... m 2 ini 
não tenha nenhuma expressão especial, vale a igualdade 




1 




II 

J, 

3“ 


«21 

1 



• • < = 

«31 

••• 5 

K> 

1 




«ml 

«m2 

«m,m—1 

1 
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onde ay = a[j*/aj j 1 . Nesta notação, indicamos com a (i * = nij.. .mi a 
matriz que se obtém depois da eliminação dos elementos abaixo da 
diagonal na j-ésima coluna. (Portanto j = 0,1,..., m — 1, e a (01 = a.) 
Estamos admitindo que não houve necessidade de efetuar trans¬ 
posição de linhas, ou seja, que em todas as etapas se tem o pivô 

Concluímos então que, mediante essa hipótese, a matriz a se es¬ 
creve como um produto 

a = lu, 

onde kM(mxm)é uma matriz triangular inferior (lower triangu¬ 
lar) com elementos diagonais todos iguais a 1 e u é uma matriz esca¬ 
lonada. Se a for uma matriz quadrada m x m então u € M(m x m) 
será uma matriz triangular superior. Esta é a chamada decom¬ 
posição lu da matriz a. 

E importante observar os seguintes fatos a respeito da decompo¬ 
sição a = lu. 

1- ) O método gaussiano de eliminação fornece diretamente os ele¬ 
mentos das matrizes leu. 

2- ) Quando se dispõe da decomposição a = lu, a solução do sistema 
ax = b, com b e M(m x 1), se reduz a resolver o sistema ly = b 
e, depois de obtida y, o sistema ux = y. O primeiro se resolve de 
cima para baixo e o segundo de baixo para cima, pois 1 é triangular 
inferior e u é escalonada. 

3- ) A maior vantagem computacional da decomposição a=lu ocorre 
quando se tem de resolver um grande número de equações ax = b, 
com a mesma matriz a e muitos vetores b. Dispondo da decom¬ 
posição a = lu não é preciso repetir muitas vezes o processo de 
eliminação gaussiana. 

4- ) A priori, não se sabe quais são (nem mesmo se vão ser ne¬ 
cessárias) as transposições de linhas durante o processo de escalona¬ 
mento de uma matriz a. Entretanto, depois de efetuado o processo, 
dispomos da relação de todas as transposições feitas. Efetuando, na 
mesma ordem em que foram feitas, todas essas transposições nas li¬ 
nhas da matriz identidade, obtemos uma matriz p € M(m x m), que 
se chama uma matriz de permutação. O produto pa corresponde a 
efetuar sobre a matriz a, antecipadamente, todas as transposições 
de linhas que seriam necessárias durante o escalonamento. Por- 
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tanto a matriz pa pode ser escalonada usando apenas operações ele¬ 
mentares do tipo Li — cxLj. Assim, tem-se a decomposição pa = lu. 

5- ) Uma condição suficiente (mas não necessária) para que uma 
matriz a e M.(m x n) possa ser escalonada sem transposições de li¬ 
nhas, portanto admita uma decomposição A = lu, é que suas subma- 
trizes principais sejam invertíveis. (Para todo número natural 
r < min{m, nf, a submatriz principal de ordem r da matriz a = [aq] 
é a matriz a r € M(r x r) formada pelos elementos aq com 1 <i<re 
1 < j < r.) 

Provemos este fato no caso de uma matriz ae M(3x4). O argu¬ 
mento no caso geral é o mesmo mas a notação se torna mais compli¬ 
cada e pode obscurecer a idéia, que é extremamente simples. Seja 



an 

ai 2 

ai3 

ai4 

a = 

a2i 

a22 

a 23 

a24 


_ a 31 

a 3 2 

Q33 

a34 


Como a matriz principal [an] é invertível, temos an / O. Usando 
ai i como pivô, efetuamos as operações elementares 

t Q 21 t t 0-31 t 

L 2 -Li e L 3 -Li 

Qn an 

sobre a matriz a, obtendo a nova matriz 


a 


(D _ 


au 

0 

0 


<Ú2 0-13 Ü14 

Ú22 Ú23 b 2 4 

b 3 2 b 33 b 34 


A matriz 


0-11 <Ú2 

0 b22 


resulta da matriz principal 


a2 


an 

ai2 

a2i 

a22 


pela aplicação da operação elementar L 2 — (a 2 i/au)Li, logo é in¬ 
vertível. Como é triangular, isto obriga b 22 / 0. Assim podemos 
tomar b22 como pivô. (Na notação geral, seria a 2 V em vez de b22.) 










Seção 17 


Tópicos Matriciais 217 


Aplicando a operação L 2 — (b 32 /b 22 )I -2 à matriz a 11 ^ chegamos à ma¬ 
triz escalonada 


- u - 

an 

Ql2 

Q13 

a 14 

0 

b22 

b23 

b24 


_ 0 

0 

C33 

C34 


O mesmo raciocínio se aplica em geral. 
Exemplo 17.1. Considerando 0 escalonamento 


'1 

2 

3 

4' 



'1 

2 

3 

4 ' 

5 

6 

7 

8 

1-2— 

5L1 

0 

-4 

-8 

-12 

9 

10 

12 

12 

c- 

9L, 

0 

-8 

-15 

-24 






'1 

2 

3 

4 ' 





1-3- 

221. 2 

0 - 

-4 

-8 

-12 







0 

0 

1 

0 



obtemos a decomposição 


'1 

2 

3 

4' 


'1 

0 

0 ' 


'1 

2 

3 

4 ' 

5 

6 

7 

8 

= 

5 

1 

0 


0 

00 

1 

1 

-12 

9 

10 

12 

12 


9 

2 

1 


0 

0 

1 

0 


que exprime a matriz do primeiro membro como um produto do tipo 
lu, de uma matriz triangular inferior com diagonal (1,1,1) por uma 
matriz escalonada com pivôs 1, —4,1. (Todos / 0 pois a matriz dada 
tem posto máximo.) 

Exemplo 17.2. Examinando, no Exemplo 9.4, as operações ele¬ 
mentares efetuadas a partir da segunda, quando não ocorrem mais 
transposições de linhas, obtemos a seguinte decomposição do tipo 

a = lu: 


'2 13 0' 


O 

O 

O 


'113 0 ' 

0 12 3 


0 10 0 


0 12 3 

3 4 2 0 


II 10 


0 0 —f —f 

4 2 0 1 


1-2 0 1 lj 


0 

0 

0 

^sl 
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17.G Matrizes Positivas: Cholesky versus lu 

Quando a matriz a = [aq] £ M(m x m) é positiva, afirmamos que 
todas as submatrizes principais a r = [aq], 1 < i, j < r, são também 
positivas, portanto invertíveis. Com efeito, dado o vetor não-nulo 
v = (xi ...,x T ), tomamos v = (xi,...,x m ), comiq = x^ para i = 1,...,r 
e iq = 0 para i = r + 1,..., m. Então v é um vetor não-nulo em M m , 
logo 

r m 

Y dijXiXj = Y_ CLijTCxTCj > 0. 
i,j=1 i,j—1 

Portanto o processo de escalonamento, quando aplicado a uma ma¬ 
triz positiva a, não requer transposições de linhas. Assim, tem-se a 
decomposição a = lu. 

Vemos que toda matriz positiva possui duas decomposições: Cho¬ 
lesky e lu. E natural indagar qual a relação entre elas. Mostraremos 
que são muito próximas: qualquer delas se obtém a partir da outra 
de modo simples. Antes porém precisamos estabelecer a unicidade 
abaixo. 

Se a matriz a é invertível então existe uma única maneira de 
escrevê-la como um produto a = lu, onde 1 é triangular inferior, com 
os elementos da diagonal todos iguais a 1, e u é triangular superior. 

Com efeito, sendo a invertível, a igualdade a = lu obriga 1 e u a 
serem invertíveis. Portanto 

a = liui = l 2 u 2 => 1 2 ] li = u 2 u 1 1 . 

Ora, o primeiro membro da última igualdade é uma matriz triangu¬ 
lar inferior e o segundo membro é triangular superior. Logo ambas 
são matrizes diagonais. Como os elementos diagonais de 1 são todos 
iguais a 1, segue-se que li = 1 2 = I m , portanto ui = u 2 e fica provada 
a unicidade da decomposição a = lu no caso de a ser invertível. 

Voltemos à matriz positiva a £ M(m x m), que admite as decom¬ 
posições a = t T .t = l.u, onde 1 é triangular inferior com l’s na dia¬ 
gonal, teu são triangulares superiores e todos os elementos da dia¬ 
gonal de t são positivos. Se indicarmos com d £ M(m x m) a matriz 
diagonal com dü = tu, então a = (t T d — 1 ) (dt) , onde t T d 1 é triangu¬ 
lar inferior com 1 ’s na diagonal e dt é triangular superior. Segue-se 
da unicidade acima provada que 1 = t T d 1 e u = dt, mostrando as- 
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sim como obter a decomposição a = lu a partir da decomposição de 
Cholesky a = t T .t. 

A expressão u = dt mostra, em particular que se a matriz a é 
positiva então, em sua decomposição a = lu, os elementos Uü da 
diagonal de u (isto é, os pivôs da eliminação gaussiana) são todos 
positivos. A unicidade da decomposição lu implica que esses pivôs 
são univocamente determinados a partir da matriz a. 

Mostremos agora como se pode obter a decomposição de Cholesky 
de uma matriz positiva a partir de sua decomposição a = lu. 

Como uü > 0 para i = 1,..., m, podemos formar uma matriz 
diagonal d = [dq] pondo dq = 0 se i / j e du = a/uu- Então escreve¬ 
mos t = d ] u. Evidentemente, a = (ld)(d _1 u). Portanto teremos a 
decomposição de Cholesky a = t T .t desde que provemos que t T = ld, 
ou seja, que u T .d 1 = ld. 

Ora, se tomarmos a transposta de ambos os membros da igual¬ 
dade a = lu obteremos a = a r = u r l r , logo podemos escrever 
a = u T .d 2 .d 2 .l T . Mas u T .d 2 é triangular inferior com l’s na diago¬ 
nal. (Na realidade, d foi definida com esse propósito.) E d 2 P é tri¬ 
angular superior. Pela unicidade da decomposição a = boldlu, vem 
u T .d 2 = 1 (e d 2 .l T = u). Daí resulta u T .d 1 = ld, como queríamos 
provar. 

Em suma: se a = lu é a decomposição de uma matriz posi¬ 
tiva, sua decomposição de Cholesky é a = (ld)(d _1 u), onde d é a 
matriz diagonal formada pelas raízes quadradas dos elementos (ne- 
cesssariamente positivos) da diagonal de u. Isto nos dá um método 
prático para obter a decomposição de Cholesky, como veremos no 
Exemplo 17.3. 

Observação O argumento acima prova, na realidade, que se a é 
uma matriz simétrica cujos pivôs são todos positivos então existe 
uma decomposição a = t T .t, logo a é uma matriz positiva. (Observe 
que, os pivôs sendo positivos, a matriz a é invertível.) 

Exemplo 17.3. Como exemplo de matriz positiva, tomemos a matriz 
de Gram dos vetores u = (1,2,1), v = (2,1,2), w = (1,1,2). Escalo- 
nando-se, obtemos 


'6 6 5' 


'6 6 5 

T 7 . 

6 6 5 ' 

6 9 7 

G-Li 

0 3 2 

G-fO 

0 3 2 

5 7 6 

G-|C 

0 2 11/6 


0 0 1/2 
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Isto nos fornece a decomposição lu: 


'6 6 5' 


O 

O 


'6 6 5 ' 

6 9 7 

= 

1 1 0 


0 3 2 

5 7 6 


5 2 1 

L6 3 J 


0 0 1/2 


Para obter a decomposição de Cholesky, tomamos a matriz diagonal 


d = 


r %/6 

0 

0 


0 0 ' 

y/ò 0 

0 y/2/2 


e calculamos 


t T = ld = 

1 

—‘ O 

O O 
_1 


1 

O o 

1_ 


Vê o o ' 

y/6 y/ò 0 


5 2 ! 

L6 3 J 


1 

o 

o 

1_ 


5 2 V2 

_V6 y/3 2 . 


Então a decomposição de Cholesky da matriz dada é 


'6 6 5' 


â. 

o 

o 


'y/6 y/6 5 /y/6' 

6 9 7 

= 

y/6 V 3 0 


0 V3 2/ y/ò 

5 7 6 


5 /y/6 2/y/l y/2/2_ 


_ 0 0 y/2/2_ 


Exercícios 

17.1. Prove que os vetores v l5 ... ,v k € E geram um subespaço veto¬ 
rial de dimensão r se, e somente se, a matriz de Gram g(vi,..., Vk) 
tem posto r. 

17.2. Se dimE < dim F, prove que existe uma transformação linear 
ortogonal A: E —> E tal que Avi = wi,..., Av^ = Wk se, e somente se, 
as matrizes de Gram g(vi,..., v k ) e g(wj,..., w k ) são iguais. 

17.3. Sejam a € M(u x n) uma matriz positiva e b e M(n x 
m) uma matriz de posto n. Ache vetores vi,... ,v m G M n tais que 
g(v 1 ,...,v m ) = b T ab. 

17.4. Prove que a T a é a matriz de Gram dos vetores-coluna de a. 
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17.5. Um operador T: E —> E chama-se triangularizável quando o 
espaço vetorial E possui uma base, relativamente à qual a matriz de 
T é triangular. Prove: 

(a) T é triangularizável se, e somente se, existe uma cadeia ascen¬ 
dente {0} = E 0 c Fi C • • • C F n = E, de subespaços invariantes 
por T, com dim E t = i (i = 0,..., n). 

(b) T é triangularizável se, e somente se, existe uma cadeia descen¬ 
dente E = G n D • • • D Gi D G 0 = {0} de subespaços invariantes 
por T tais que dim Gi = i para i = 0,1,..., n. 

(c) Se existe uma base de E na qual a matriz de T é triangular 
superior, existe também uma base de E na qual a matriz de T 
é triangular inferior. 

(d) T é triangularizável se, e somente se, T* é triangularizável. 

17.6. Seja t = [tq] € M(u x n) uma matriz triangular. Prove que os 
elementos tu da diagonal de t são autovalores do operador T: R n —> 
R n cuja matriz na base canônica é t. Conclua que t é diagonalizável 
quando sua diagonal não possuir elementos repetidos. 

17.7. Seja A: R 3 —> R 3 o operador definido por A(x,y,z) = (x + 
2y + 3z,y +2z, 3z). Obtenha dois autovetores L.I. para A e prove que 
qualquer outro autovetor de A é múltiplo de um desses dois. Conclua 
que A não é diagonalizável, embora sua matriz seja triangular. 

17.8. Considere o operador B: R 3 —> R 3 , dado por B(x,y,z) = (x + 
2z, y +3z, 4z), cuja matriz é triangular. Ache uma base de R 3 formada 
por autovetores de B. 

17.9. Dada a matriz positiva 

'1 2 

a “ [2 5_| ’ 

determine 


de modo que se tenha a decomposição de Cholesky a = t T .t. 
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17.10. Use o método do exercício anterior, de modo a obter a decom¬ 
posição de Cholesky da matriz positiva 


3 4 

4 6 
6 9 


6 ' 

9 

14 


17.11. Aplicando o processo de Gram-Schmidt às colunas da matriz 


a = 


'1 2 

3 3 

4 -1 


obtenha a decomposição a = qr, onde q é ortogonal e r é triangular 
superior, com elementos positivos na diagonal. 

17.12. Mostre como obter, a partir dos teoremas demonstrados nas 
seções anteriores, cada uma das matrizes cuja existência é assegu¬ 
rada nos itens 1), 2), 3) e 4) de 17.E (Por exemplo, no item 1), se 
A: R n —> M n é o operador cuja matriz na base canônica £ C M n é a 
então p é a matriz cujas colunas são os vetores de uma base orto- 
normal U = {u i,..., u n } c M n , formada por autovetores de A e d é a 
matriz diagonal formada pelos autovalores correspondentes.) 

17.13. Dada a matriz 

1 V 
a_ [2 lj ’ 

obtenha sua decomposição a = pdq a valores singulares. 

17.14. Assinale V(erdadeiro) ou F(also) 


( ) Toda matriz quadrada escalonada é triangular superior. 

( ) Toda matriz (quadrada) triangular superior é escalonada. 

( ) As duas afirmações anteriores são verdadeiras quando se trata 
de matrizes invertíveis. 

( ) Se a matriz a admite uma decomposição do tipo a = lu então 
todas as submatrizes principais de a são invertíveis. 
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17.15. Prove que a matriz 

0 a 

a= u 

b c 

admite uma decomposição do tipo a = lu se, e somente se, b = 0. 

17.16. Obtenha a decomposição lu das matrizes 


'1 

2 

2 



'2 

1 

0 

4' 

3 

3 

4 

e 

b = 

4 

5 

1 

7 

4 

-1 

3 



2 -8 

-1 

12 


17.17. Seja a € M(m x n) uma matriz de posto máximo que admite 
uma decomposição do tipo a = lu, onde 1 £ M(m x m) é triangular 
inferior, com elementos da diagonal todos iguais a 1, e u' € M(mxn) 
é escalonada. Prove que existem uma matriz diagonal invertível 
d e M(m x m) e uma matriz escalonada u € M(m x n), com pivôs 
todos igual a 1, tais que a = ldu. 

17.18. Obtenha a decomposição lu da matriz do Exemplo 9.3. 

17.19. A partir da decomposição lu, obtenha a decomposição de 
Cholesky das matrizes positivas a = matriz de Gram dos vetores 
u = (1,2,1), v = (1,1,2), w = (2,1,3) e b = produto da matriz 

'iii r 
12 11 

m= 2 1 2 2 
2 2 13 


por sua transposta. 

17.20. Foi visto no texto que se a = lu é a decomposição da matriz 
positiva a e d é a matriz diagonal formada pelas raízes quadradas 
dü = -y/üu dos pivôs então a = (ld) • (d -1 u) é a decomposição de 
Cholesky de a. Modifique ligeiramente este argumento para provar 
que existe uma decomposição de Cholesky a = t T .t para qualquer 
matriz não-negativa a. (Mas agora não há unicidade.) 
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Uma forma quadrática num espaço vetorial E é uma função que, em 
termos das coordenadas de um vetor relativamente a uma base de E, 
se exprime como um polinómio homogêneo do segundo grau. As for¬ 
mas quadráticas ocorrem com grande destaque em problemas de oti¬ 
mização (máximos e mínimos), no estudo das superfícies quádricas, 
na Geometria Diferencial, na Mecânica, etc. Em todas essas situa¬ 
ções, é relevante o conhecimento do sinal (positivo ou negativo) que 
a forma pode assumir ou, mais precisamente, dos seus autovalores. 
Nesta seção, é feito um estudo conciso, porém abrangente, dos princi¬ 
pais pontos básicos referentes a essas funções e de suas relações com 
os operadores lineares, finalizando com o método de Lagrange para 
diagonalização e a classificação das superfícies quádricas. 

Sejam E, E espaços vetoriais. Uma forma bilinear b: E x F —> R 
é uma função b(u,v), linear em cada uma das duas variáveis u € E, 
v e E. Mais precisamente, para quaisquer u, u' € E, v,v' € E e a € R 
devem valer: 

b(u + u', v) = b(u, v) + b(u',v); b(ctu,v) = ab(u,v) 
b(u,v + v') = b(u,v) + b(u,v'); b(u, <xv) = ab(u,v). 

As operações evidentes de soma e produto por um número fazem 
do conjunto B{ E x E) das formas bilineares b:ExE-)R um espaço 
vetorial. 


Seção 18 


Formas Quadráticas 225 


Tomando bases U = {ui,..., u m } c Ee V == {vi,..., v n } c F, os 
números bq = b(uqVj) definem uma matriz b = [bq] e M(m x n), 
chamada a matriz da forma bilinear b relativamente às bases U, V. 

Conhecidos os valores bq = b(ut, Vj), os quais podem ser tomados 
arbitrariamente, a forma bilinear b:ExF —> M fica inteiramente 
determinada pois, para u = IxíUí € E e v = IpjVj € F quaisquer, 
tem-se 

b(u,v) = b(ui,Vj) = ^bijXiyj, 1 < i < m, 1 < j < n. 


A correspondência que associa a cada forma bilinear b: E x F —> M 
sua matriz b = [bq] relativamente às bases U c E, V c F (supos¬ 
tas fixadas) é um isomorfismo entre os espaços vetoriais B[ E x E) e 
M(m x n). Segue-se que £>(E x F) tem dimensão mn. 

Dadas novas bases W = {u 7 ,,..., u^} c E e V = {v^,..., v^} c E 
sejam 


m 


n 



e b-j = b(u-, vj). A matriz da forma bilinear b relativamente às bases 
W e V é b 7 = [bF] G M(m x n). O teorema abaixo exprime b 7 em 
função de b e das matrizes de passagem p = [pq] e M(m x m), 

q = [qq] € M(n x n). 

Teorema 18.1. As matrizes b e b 7 , da forma bilinear b nas bases 
U, V e W, V 7 respectivamente, se relacionam pela igualdade b 7 = 
p T bq, onde p é a matriz de passagem de U para W e q é a matriz de 
passagem de V para V 7 . 

Demonstração: Para todo i = 1,..., m e todo j = 1,..., n, temos 



r,s 


r,s 


logo b 7 = p T bq. 


□ 
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Embora transformações lineares e formas bilineares sejam am¬ 
bas representáveis por matrizes (quando são fixadas bases), vemos 
que, ao mudarem essas bases, a matriz de uma forma bilinear se 
altera de maneira diferente daquela de uma transformação linear. 

Quando E — F, nos referiremos sempre (salvo aviso em contrário) 
à matriz de uma forma bilinear b: E x E —> R relativamente a uma 
únicabas eU = {u 1( ... ,u m } C E. Essa matriz éb = [bq] € M(mxm), 
onde btj = b(ui,Uj). 

Se b' é a matriz da mesma forma b em relação a outra base W'cE 
então b' = p T bp, onde p é a matriz de passagem da base U para 
a base W . A correspondência b h b define um isomorfismo entre 
£>( E x E) e M(m x m), estabelecido com ajuda da base U. Dados 
u = IxtUj. e v = EyiUi em E, se a matriz de b na base Ué b = [bq], 
tem-se 


m 



Assim, b(u,v) é um polinómio homogêneo do 2- grau em relação 
às coordenadas de u e v. 

Uma forma bilinear b: E x E —> R chama-se simétrica quando 
b(u,v) = b(v, u) para quaisquer u,v € E. Para que b seja simétrica 
é suficiente que sua matriz em relação a uma base U C E seja 
simétrica e é necessário que sua matriz em relação a qualquer base 
de E seja simétrica. Com efeito, se bq = bq então 

b(v,u) = Y bijPiXj = Y bjjXjPi 


Y bjjXjTJj = ^bapXaPp = b(u,v). 


Observação. O quarto sinal de igualdade na seqüência acima faz 
uso de uma manipulação que pode parecer desonesta mas é perfei¬ 
tamente correta. O princípio é o seguinte: num somatório, o nome 
do “índice de somação”, ou “índice mudo”, não tem a menor im¬ 
portância: 


m 


m 


m 



Seção 18 


Formas Quadráticas 227 


O que importa é que ao substituir o índice mudo i por (3 (bem como 
j por a) essa substituição se faça em todos os lugares onde i ocorra 
(assim como j) e somente nesses lugares. 

Analogamente, uma forma bilinear b: E x E —> M chama-se 
anti-simétrica quando b(u,v) = —b(v,u) para u,v € E quaisquer. 
Para que b seja anti-simétrica é suficiente que se tenha b(ut,uj) = 
—b(iij,Ui) ou seja, by = — bjt numa base {ui,... ,u m } c E. 

Uma forma bilinear b, ao mesmo tempo simétrica e anti-simétri¬ 
ca, deve ser nula. Este fato, juntamente com a igualdade 

b(u, v) = ^[b(u, v) + b(v,u)] + ^[b(u, v) - b(v,u)], 

mostra que o espaço B[ E x E) das formas bilineares b: E x E —> R 
é a soma direta de dois subespaços, um deles formado pelas formas 
simétricas e o outro pelas formas anti-simétricas. 

Exemplo 18.1. Dados os funcionais lineares f: E —> M, g:F—>R, a 
função b:Exl-)I, definida por b(u,v) = f(u)g(v), é uma forma 
bilinear, chamada o produto tensorial de f e g. Se E e E são dotados 
de produto interno, fixados u 0 € E e v Q e E, a função b: E x E —> 
M, onde b(u,v) = (u, u 0 ) • (v,v 0 ), é uma forma bilinear. No caso 
particular em que E = E, dados f, g: E —> M, funcionais lineares, 
então as igualdades 

(f • g)(u,v) = f(u)g(v) + f(v)g(u) 


e 

(f Ag)(u,v) =f(u)g(v) -f(v)g(u), 

definem formas bilineares f• g, f Ag: E x E —> M, a primeira simétrica 
e a segunda anti-simétrica. 

Teorema 18.2. Seja E um espaço vetorial de dimensão finita provido 
de produto interno. Para cada forma bilinear b: E x E —> R existe um 
único operador linear B: E E tal que 

(u, Bv) = b(u, v) para u, v e E quaisquer. 

A correspondência b h B, assim definida, é um isomorfismo entre 
os espaços vetoriais B {E x E) e £(E). A forma bilinear b é simétrica 
(respect. anti-simétrica) se, e somente se, o operador B é auto-adjunto 
(respect. anti-simétrico). 
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Demonstração: Para cada v Q € E, a função f : E —> R, definida por 
f(u) = b(u,v 0 ), é um funcional linear. Pelo Teorema 11.1, existe um 
único vetor em E, que indicaremos com Bv 0 , tal que f(u) = (u, Bv 0 ), 
ou seja (u, Bv 0 ) = b(u, v 0 ) para todo u € E. Como v 0 € E é arbitrário, 
acabamos de mostrar que existe uma única função B: E —> E tal que 
(u, Bv) = b(u,v) para quaisquer u,veE. Dados v,v' € E, tem-se 

(u,B(v + v')> = b(u,v + v') 

= b(u,v) + b(u,v') 

= (u, Bv) + (u, Bv') 

= ^u, Bv + Bv 7 ) 

para todo u 6 E, logo B(v+v') = Bv+Bv'. De modo análogo se verifica 
que B(cxv) = cx(Bv) para <x e R e v e E quaisquer, portanto B: E —> E 
é linear. Em relação a uma base ortonormal U = {ui,... ,u m } C E, 
o ij-ésimo elemento da matriz de B é (eqBej) = b(ei, ej) = ij-ésimo 
da matriz de b. Assim, a forma bilinear b e o operador B que a 
ela corresponde têm a mesma matriz na base U. Daí decorre que a 
correspondência b h B é um isomorfismo entre B {E x E) e £(E) e 
que B é auto-adjunto (respect. anti-simétrico) se,e somente se, b é 
simétrica (respect. anti-simétrica). □ 

Uma função cp: E —> M chama-se uma forma quadrática quando 
existe uma forma bilinear b: E x E —> R tal que cp(v) = b(v,v) para 
todo veE. 

Se, em vez da forma bilinear b tomarmos a forma bilinear simé¬ 
trica 

b' (u, v) = - [b (u, v) + b (v, u)], 

teremos ainda 

<p(v) = b(v,v) = ^[b(v,v) +b(v,v)] = b'(v,v). 

Portanto, não há perda de generalidade em se exigir que a forma 
quadrática cp(v) = b(v,v) provenha de uma forma bilinear simétrica 
b. Isto é o que faremos doravante. Com uma vantagem: se b é 
simétrica, todos os seus valores b(u,v) podem ser determinados a 
partir dos valores b(v,v) = cp(v) da forma quadrática cp. Com efeito, 
tem-se a seguinte fórmula de polarização-. 

b(u,v) = ^[b(u + v,u + v) — b(u,u) — b(v,v)]. 
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Se b = [btj] é a matriz da forma bilinear b na base U = 
{ui ,..., u m } c E então, para v = IxíUí, tem-se 


m 

<p(v) = y bijXiXj. 

y=i 

Note que, sendo b uma matriz simétrica (como sempre supore¬ 
mos quando tratarmos de formas quadráticas), cada parcela com 
i / j aparece duas vezes na soma acima: uma vez como bqXiXj e 
outra vez como b^Xi, o que é o mesmo. 

A matriz da forma quadrática cp na base U é, por definição, a 
matriz b, nesta mesma base, da forma bilinear b tal que cp(v) = 
b(v,v). Se a matriz de passagem p levar a base U na base W, a 
matriz b' da forma quadrática cp na base W será dada por b' = p T bp. 

Note que se E possuir produto interno e as bases U, W forem am¬ 
bas ortonormais, a matriz p será ortogonal, logo p T = p 1 . Então 
b' = p ] bp. Isto confirma o que foi visto no Teorema 18.1: relati¬ 
vamente a bases ortonormais a matriz da forma bilinear b coincide 
com a do operador B, que lhe corresponde de maneira intrínseca. 

Teorema 18.3. Seja E um espaço vetorial de dimensão finita munido 
de produto interno. Dada uma forma bilinear simétrica b: E x E —> M, 
existe uma base ortonormal U = {ui,..., u m } c E tal que b(ut, Uj) = 0 
se i / j. 

Demonstração: Pelo Teorema 18.2, existe um operador auto-adjun¬ 
to B: E —} E tal que b(u,v) = (u, Bv) para quaisquer u,v € E. O 
Teorema Espectral assegura a existência de uma base ortonormal 
U = {ui,...,u m } C E tal que Btq = Apiq (i = Então 

i =>• b(ui,Uj) = (ui, Buj) = (ut, AjUj) = Aj (u^Uj) = 0. D 

O teorema acima é a versão, para formas bilineares, do Teorema 
Espectral. Por sua vez a versão matricial do Teorema 18.3 é a se¬ 
guinte: para toda matriz simétrica b = [bq] € M(m x m), existe uma 
matriz ortogonal p e M(m x m) tal que p T bp = p _1 bp é uma matriz 
diagonal. A diagonal de d = p T bp é formada pelos autovalores de 
b, os quais se dizem também autovalores da forma bilinear b e da 
forma quadrática cp(v) = b(v,v). 
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Em termos das coordenadas dos vetores u = IxtUi e v = ZyjUj re¬ 
lativamente à base U do Teorema 18.3 a forma bilinear b se exprime 
como 

b(u,v) = lAiXtyt. 

Em particular, a forma quadrática (p: E —> R, cp(u) = b(u, u), 
para v = lypiii (expressão relativa à base U) é dada por uma combi¬ 
nação linear de quadrados: 

<P(v) = lAty? = Aiyf + • • • + A m y^ . 

É costume numerar os autovalores A^ em ordem crescente: Ai < 
A 2 < ■ ■ ■ < A m . 

A forma quadrática cp: E —> R diz-se não-negativa quando 
<p(v) >0 para todo v € E, positiva quando cp(v) >0 para todo v / 0 
em E, não-positiva quando cp(v) < 0 para todo v € E, negativa quando 
cp(v) < 0 para todo v/0 em E e indefinida quando existem u,v € E 
tais que cp(u) > 0 e cp(v) < 0. 

A forma quadrática cp: E —> Ré não-negativa, positiva, não- 
positiva, negativa ou indefinida, respectivamente, conforme 0 ope¬ 
rador auto-adjunto B: E —> E, tal que cp(v) = (v,Bv), tenha uma 
dessas propriedades, ou seja, conforme os autovalores AiA m se¬ 
jam todos > 0, todos > 0, todos < 0, todos < 0 ou Ai < 0 < A m 
respectivamente. 

Se A] < ■ ■ ■ < A m são os autovalores da forma quadrática cp então, 
para todo vetor unitário u € E tem-se Ai < cp(u) < A m . Com efeito, 
relativamente à base U do Teorema 18.3, se u = IxtUi então Ix? = 1, 
portanto: 


Ai s= Y Aix? < a Aí = <p(u) < ^ A m x? = A m . 

1 1 í 

Além disso, cp(ui) = At e cp(u m ) = A m . Portanto, 0 menor au¬ 
tovalor Ai e 0 maior autovalor A m são também 0 valor mínimo e 0 
valor máximo assumidos pela forma quadrática cp entre os vetores 
unitários de E. 

Em Análise, quando se estudam os pontos críticos de uma função 
diferenciável, um papel crucial é desempenhado por uma forma qua¬ 
drática, chamada forma Hessiana. Os pontos críticos são classifica¬ 
dos de acordo com 0 número de direções independentes ao longo das 
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quais a função tem um máximo relativo e esse número coincide com 
o índice da forma Hessiana, como definiremos a seguir. 

O índice de uma forma quadrática cp : E —> M é a maior dimensão 
de um subespaço vetorial de E restrita ao qual a forma é negativa. 
Quando cp > 0, diremos que o índice de cp é zero. 

Portanto, o índice da forma quadrática cp: E —> R é igual ao 
número i / 0 quando: 1) Existe um subespaço vetorial E c E, com 
dim E = i, tal que cp(v) < 0 para todo vetor não-nulo v e E; 2) Se 
G c E é um subespaço vetorial de dimensão maior do que i, existe 
algum vetor não-nulo w E G, tal que cp(w) > 0. 

Se dim E = m então toda forma quadrática negativa cp: E —> M 
tem índice m. 

Assim definido, o índice de uma forma quadrática é uma noção 
intrínseca, independente de escolhas ou construções arbitrárias. 

Outro invariante numérico associado a uma forma quadrática 
cp: E —> M é o seu posto. Seja b:ExE-)Ra (única) forma bilinear 
simétrica tal que cp(v) = b(v,v) para todo v E E. Escolhendo uma 
base V = (v 1 ,...,v TT J C E e pondo bq = b(vqVj), i,j = 
sabemos que, para todo vetor 

v = y~ XjVj, tem-se cp(v) = bqXjXj. 

Por definição, o posto de cp é o posto da matriz b = [bq] E M(m x m). 

Para provar que o posto de cp, definido desta maneira, não de¬ 
pende da base escolhida, observemos que se tomarmos outra base 
V = {ví ,..., v' m } c E a forma cp será representada pela matriz b' = 
p T bp, onde p € M.(m x m) é a matriz de passagem de V para V'. 
Como pep T são invertíveis, é claro que beb' = p T bp têm o mesmo 
posto. 

Em particular, se existir uma base V = (vi,..., v m ) C E tal que 

cp (v) = Ai xf 4-E A r x^ (com Ai / 0,..., A T / 0) 

para todo v = IxíVí, então a matriz de cp na base V tem Ai,..., A r 
na diagonal e os demais elementos iguais a zero, logo o posto de cp, 
igual ao posto desta matriz, é r. 

Se E tem um produto interno e cp(v) = (v, Bv) então o posto 
da forma quadrática cp é igual ao posto do operador auto-adjunto 
B: E —> E. 
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Teorema 18.4. (Lei da inércia, de Sylvester.) Se existir uma base 
V = (vi,..., v m } C E tal que, para todo v = IxjVj € E se tem 

<p (v) = — x] - x\ + x? +1 H- \-x$ 

então a forma quadrática cp tem índice í e posto r. 

Demonstração: Já vimos acima que o posto de cp é r. Quanto ao 
índice, seja E c E um subespaço vetorial, restrito ao qual tp é nega¬ 
tiva. Mostremos que dim E < i. Com efeito, se o vetor não-nulo 

m 

v = Y_ XjVj 
1=1 


pertencer a F então 

— X] — ■ ■ ■ — xf + xl + i + • • • + x^r < 0, 


logo 


x]-\ -h x\ > 0 


e daí (xi,...,xt) / 0. Isto mostra que a transformação linear A: E 
K l , definida por 


XjVjJ = (x 1 ,...,x í ), 

é injetiva, portanto dim F < i. Para finalizar, observamos que o 
subespaço gerado por vi,..., ví tem dimensão i e, restrita a ele, 

cp(v) = -xf- x{ 

é negativa, Logo i é a maior dimensão de um subespaço de E, restrita 
ao qual cp é negativa. □ 

Usualmente, a Lei da Inércia de Sylvester é enunciada sob a se¬ 
guinte forma equivalente: seja qual for a base V = {vi,... ,v m } C E 
tal que 

<P (v) = -x] - x{ + x? +1 -I-hxj (*) 

para v = LxjVj, os números i e r são os mesmos. 


Av = A H 


J=i 
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Apresentaremos a seguir o método de Lagrange (de completar o 
quadrado) para obter uma base no espaço vetorial E, relativamente 
à qual uma dada forma quadrática cp: E —> M tenha uma matriz 
diagonal cujos elementos não-nulos são iguais a 1 ou —1. Noutras 
palavras, nessa base, cp tem uma expressão do tipo (*) acima. 

Comecemos com uma base qualquer U = {ui,...,u m } c E, na 
qual se tem 



para v = xiui + • • • + x m u m . Se a = [ay] € M(m x m) é a matriz de 
passagem da base U para a base V = {vj,..., v m }, a nova expressão 


<P(v) =^c íj y i p j , 


para v = yivi + • • • + y m v m , se obtém simplesmente efetuando em 
(**) a substituição, ou mudança de variáveis, 



De agora em diante, mencionaremos apenas cada mudança de 
variáveis, deixando implícito que ela corresponde à passagem de 
uma base para outra pois, em cada caso, a matriz a = [ay] [ou o 
que é o mesmo, o operador (yi,..., y m ) i-> (xi,..., x m )] é invertível. 

A partir da expressão 



faremos, se necessário, uma mudança de variáveis para assegurar 
que algum elemento bü da diagonal seja diferente de zero. (Estamos 
supondo que cp não seja identicamente nula, do contrário nada ha¬ 
veria a fazer.) Pois se todos os elementos da diagonal fossem iguais 
a zero, escolheríamos um b rs / 0, com r/se faríamos a mudança 
de variável x T = y r + y s , x s = y r — y s , xi = yt (se i ^ {r, s}). Então a 
parcela 2b rs x T x s da soma cp(v) se transformaria em 2b Ts y^ — 2b Ts y[: e 
agora, nas novas variáveis yt, a expressão de cp(v] contém ao menos 
dois termos não nulos, c TT yjr = 2b rs y^ e c ss yj = —2b rs yj, os quais não 
se cancelam com nenhuma das outras parcelas. 
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Voltemos à expressão cp(v) = ZbqXiXj, onde podemos agora su¬ 
por que algum bü 7 ^ 0. Mudando, se necessário, a numeração das 
variáveis (0 que equivale a mudar a ordem dos vetores da base), po¬ 
demos admitir que bn /O. Então escrevemos 


<p(v) = bn 


+ 2 xi 


L 

í>2 


CjXj 




onde Cj = bq/bn e \p(v') depende apenas de 

V = 

j>2 

ou seja, 4> é uma forma quadrática definida no subespaço F c E, 
de dimensão m — 1, gerado por U 2 ,..., u m . A expressão dentro dos 
parênteses acima é do tipo a 2 + 2 ab, logo é igual a (a + b ) 2 — b 2 , onde 


a = X] e b = ^ CjXj. 

j>2 

Assim, a mudança de variáveis 

Z-i =X] +Y_ CjXj, Z 2 = X 2 , . . . , Z m = X m 
í>2 

ou, equivalentemente, 

X] = Z] ) CjZj, X2 = Z2, ..., x m = z m , 
í>2 


mostra que a expressão dentro dos parênteses acima é igual a 

2 




') > 


J>2 


portanto 


tp(v) = bnzf — bn ( Y CjZj ] +iKv') 

J > 2 
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ou seja, cp(v) = bnz 2 + E(v') onde, outra vez, L, é uma forma quadrá¬ 
tica no subespaço F, de dimensão m — 1. Efetuando a nova mudança 
de variáveis 

= z i=yj 9 >2), 

Vlbnl 

obtemos cp(v) = ±y 2 + £,(v'). Aplicando o mesmo método a í, e pros¬ 
seguindo analogamente, chegaremos no final a 

cp(v) = 

ou, mais explicitamente: 

<p(v) =-yi - Vi +bi+i + -- - + y?> 

onde i é o índice e r o posto da forma quadrática cp. Os números 
Pj são as coordenadas do vetor v na base de E obtida após a última 
mudança de coordenadas. 

Exemplo 18.2. Seja <p:K 3 -)Ka forma quadrática dada por 

(p (x, y, z) = 2x 2 + 2y 2 — 2z 2 + 4xy — 4xz + 8y z. 

Completando o quadrado, vemos que a soma das parcelas que con¬ 
têm o fator x se escreve como 

2x 2 + 4xy — 4xz = 2[x 2 + 2x(y — z)\ 

= 2[x 2 + 2x(y - z) + (y - z) 2 } - 2{y - z) 2 
= 2(x + y — z) 2 — 2(y — z) 2 . 

A mudança de variáveis s = x + y — z nos dá então 

<p(x,y> z) ~ 2s 2 - 2(y - z) 2 + 2y 2 - 2z 2 + 8yz 
= 2s 2 — 4z 2 + 12yz. 

Novamente completamos o quadrado, agora na soma das parcelas 
que contêm z, e obtemos 

—4z 2 + 12yz = —4 ^z 2 — 2z • ^y 

= -4 (z 2 - 2z • jy + ^y 2 ^ + 9y 2 
= - 4 (z-^y) +9y 2 . 
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A mudança de variáveis t = z — |y nos dá portanto 
cp(x,y,z) = 2s 2 — 4t 2 + 9y 2 . 


Isto já nos diz que a forma quadrática cp tem posto 3 e índice 1, logo 
é indefinida. 

Se quisermos, podemos fazer a mudança de variáveis 


s 




3 


e teremos 

(p(x,y,z) =yi~V 2 + y 3 . 

Evidentemente, não há dificuldade em obter a expressão das va¬ 
riáveis y 1 , i )2 e i )3 em função de x, y, z e vice-versa. Mas, para efeito 
de conhecer 0 índice e 0 posto de cp, isto é desnecessário. 


Quádricas 

O estudo das formas quadráticas tem uma aplicação interessante 
à Geometria Analítica n-dimensional, que apresentaremos breve¬ 
mente aqui. 

Um subconjunto IcM n chama-se uma quádrica central quando 
existe uma forma quadrática cp: M n —> M tal que L é definido pela 
equação cp(v) = 1 . 

Se 

<P(V) - Y lijXiXj 
ti 

para v = (xi,...,x n ), isto significa que I é 0 conjunto dos pontos 
(xi,..., x n ) € K n tais que 


y Q ij xiXj = 1. 

í,j=i 

Segue-se imediatamente do Teorema 18.3 que, dada uma quádri¬ 
ca central I c R n , existe uma base ortonormal U = (ui,..., u n } em 
M n , relativamente à qual a equação de I é 

AiUi+■■■ + = 1) 
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onde Ai,..., A n são os autovalores da matriz simétrica [ay]. 

Noutras palavras, quando se exprime o vetor v = yiuH-hy n Un 

como combinação linear dos elementos da base U, tem-se v e L se, e 
somente se, suas coordenadas yi,... ,y n satisfazem a equação 

Y_ Aty? = 1 • 


As retas que contêm os vetores rq da base U chamam-se os eixos 
principais da quádrica central L. 

Quando n = 2, I chama-se uma cônica. Portanto, a cônica defi¬ 
nida em M 2 pela equação 


ax 2 + 2bxy + cy 2 = 1 


pode, numa nova base ortonormal de M 2 , ser representada pela e- 
quação 

As 2 + pt 2 = 1, 


onde A, p são os autovalores da matriz 


a b 
b c 


Segundo os sinais desses autovalores, as seguintes possibilidades 
podem ocorrer: 


1-) Se Ap < 0 (isto é, ac < b 2 ) tem-se uma hipérbole. 

2 ») Se A > 0 e p > 0 (isto é, a > 0 e ac > b 2 ) tem-se uma elipse. 

3- ) Se A < 0 e p < 0 (isto é, a < 0 e ac > b 2 ) tem-se o conjunto 

vazio. 

4- ) Se Ap = 0 (isto é, ac = b 2 ) tem-se um par de retas paralelas, ou 

o conjunto vazio, conforme seja a + c>0oua + c<0. 


Evidentemente, quando A = p > 0 tem-se uma circunferência. 

E claro que, em cada caso concreto, dada a equação ax 2 + 2bxy + 
cy 2 = 1, uma aplicação imediata do método de Lagrange (de comple¬ 
tar o quadrado) permite escrever o primeiro membro sob a forma 
biy 2 + b 2 y 2 e daí constatar, conforme os sinais de bi e b 2 , se se 
trata de elipse, hipérbole ou um par de retas. Convém ter em conta, 
porém, que o método de Lagrange, embora eficiente (principalmente 
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em dimensões maiores do que 2 , onde é muito difícil calcular os au¬ 
tovalores), não fornece bases ortonormais. Em particular, ele não 
permite distinguir uma elipse de uma circunferência. 

Em dimensão 3, as superfícies quádricas centrais Z c M 3 têm, 
num sistema de coordenadas ortogonais conveniente, uma equação 
do tipo 

Aiyf + A 2 y| + A 3 y| = 1. 

As possibilidades são as seguintes: 

1?) Se À! > 0 , À 2 > 0 e Â 3 > 0 , Zé um elipsóide. 

2?) Se À! > 0, À 2 > 0 e À 3 < 0, Z é um hiperbolóide de revolução. 

3- ) Se A, > 0, À 2 < 0 e À 3 < 0, Z é um hiperbolóide de duas folhas. 

4- ) Se Ai, A 2 e A 3 são < 0, Z é 0 conjunto vazio. 

5- ) Se A 3 = 0, Z = C x R = {(v,t);v € C,t € M}, onde C C M 2 é 

definido pela equação 

Aiyf + A 2 y 2 = 1- 

Neste caso, Z é um cilindro de base C. 

Observe que, mudando a numeração das coordenadas se neces¬ 
sário, podemos sempre supor Ai > 0 . 

Há outro tipo mais geral de quádricas, além das centrais. São 
subconjuntos Z c R n definidos por uma equação do tipo 

n n 

Y a b + Y bíXi = c - 

1-0=1 i=1 

A escolha de uma base ortonormal conveniente em R n faz com 
que esta equação assuma a forma 

r n 

Y A íyt+ Y b íy* = c > 

i=1 i—1 

onde r é 0 posto da matriz [aq] e Ai / 0,..., A T / 0. 

Procurando eliminar 0 termo linear Zb'tq mediante escolha de 
novas coordenadas, somos levados a efetuar uma translação. (Até 
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agora nossas mudanças de coordenadas eram feitas por meio de 
transformações lineares, logo preservavam a origem.) Introduzindo 
as novas coordenadas 



Zr+1 — Dr+1) 


Zn — Uri) 

a equação acima se torna 


Àizf + • • • + A r Z? + b^ + 1 Zr+l + ■ ■ ■ + b^Zn — c ', 

na qual conseguimos eliminar os r primeiros termos lineares. 

Pode ocorrer que os coeficientes bj sejam todos iguais a zero. 
Neste caso, a forma simplificada que buscamos para a equação da 
quádrica I é: 

Àizf 4-1- A r z^ = c'. 

Se r = n, I é simplesmente a figura que resulta de uma quádrica 
central depois de uma translação. Se r < n então as últimas n — r 
coordenadas Zr + i,..., z n podem ser tomadas arbitrariamente, en¬ 
quanto as r primeiras definem uma quádrica em M T , logo L é um 
cilindro generalizado: produto cartesiano I = I' x M n ~ r onde L' é 
uma quádrica em M r . 

Se algum dos números b- (r + 1 < j < n) for / 0, introduziremos 
novas coordenadas ti,..., t n de tal modo que tj = zi,..., t r = z r e 

br+1 Z r +1 -I-h b^Zn - c' = dt r+ i. 

Primeiro fazemos uma translação de modo a eliminar c'. Para isso 
escolhemos um ponto (z° +1 ,..., z°) tal que 

K+^+--- + K< = c' 


e escrevemos 


Sl — Zl, . . . , S r — Zr, 


Sr+1 — Zr4-1 Z r _(_i, . . . , S n — Zn Z n . 
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Então, nas coordenadas st, a equação da quádrica L se torna: 

Àisf H-b A r s^ + s r -)-i + • • • + b n s n = 0. 

No espaço R n_r , a expressão 


b r+1 s r+1 + ‘ ‘ ‘ + b^S n 


é o produto interno (b, w), onde 

b = ( b r+1>---> b n) e W = (s r+ l,...,S n ). 

Escolhamos nesse espaço uma base ortonormal cujo primeiro ele¬ 
mento seja o vetor unitário u = b/|b|. Sejam (t r+ i,... ,t n ) as coor¬ 
denadas do vetor w = (s r+ i,..., s n ) nesta base. Então t r+ i = (u, w), 
logo (b,w) = |b|t T+ i. Escrevendo ti = si,... ,t r = s r , vemos que, nas 
novas coordenadas tt a equação da quádrica I assume a forma: 

Àit| + • • • + A T tp + dt T+ i = 0, 


onde d = |b|. 

Observemos que todas as mudanças de coordenadas foram fei¬ 
tas mediante translações e transformações lineares ortogonais (ou, 
o que é o mesmo, escolhas de bases ortonormais). Podemos então 
concluir que, dada uma quádrica: 

n n 

I: y qjj XiXj + Y_ b i x i = C (*) 

y=i i=i 

em M n , existe uma mudança de coordenadas 

n 

x i = ^m i jt j + k i (i = 1,..., n) 
j=i 

tal que m = [mq] é uma matriz ortogonal e, efetuando essa transfor¬ 
mação na equação (*) de I, ela se torna 

A]t| + • • • + A r t~ + dt T+ i =0, (d / 0) 

ou 

Ai tf H-b A r t" = c', 
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onde r é o posto da matriz [ay] e Ai,..., À r são os seus autovalores 
não-nulos. No primeiro caso, supondo r = u — 1, a quádrica I pode 
ser definida por 

tn = oqt? H-+ 0C n -ltn_1 

(com = —Ai/d) e chama-se um parabolóide. 


Exercícios 

18 . 1 . Determine a matriz de cada uma das formas bilineares abaixo, 
relativamente à base especificada: 

(a) b: I 4 x M 4 -) 1, b(u,v) = (u,v), base (vi,V 2 ,V 3 ,V 4 ) C M 4 , onde 
v, =(—2,0,3,1), v 2 =(l, 2,1,-1), v 3 =(0,1,2, -1), v 4 =(l, 2,3,1). 

(b) b: l n x R n -) M, b(u,v) = (Au,v), A € base canônica 

de M n . 

(c) b:I n xl n -il, b(u,v) = (Au, Bv), A, B G £(M n ), base canônica 
de M n . 

(d) b: M n x M n —> M, b (u, v) = (u, a) • (v, b), a, b G M n , base canônica 
de M n . 

18 . 2 . Seja cp: M 3 —> R a forma quadrática dada por cp(x,y,z) = x 2 + 
y 2 — z 2 + 2xy — 3xz + yz. Qual é a matriz de cp na base (u, v, w) c M 3 , 
onde u = (3, 0,1), v = (1, —1,2), w = (2,1, 2) ? 

18 . 3 . Prove que o conjunto das formas quadráticas no espaço veto¬ 
rial E é um subespaço vetorial Q(E) c .F(E;M). Se dim E = n, prove 
que dim Q(E) = n(u + 1 )/2. 

18 . 4 . Assinale V(erdadeiro) ou F(also): 

( ) O conjunto das formas quadráticas de índice i no espaço veto¬ 
rial E é um cone convexo em ,F(E;M). 

( ) A matriz do operador B: E —> E na base U é igual à matriz da 

forma bilinear b(u, v) = (u, Bv) na mesma base. 


242 Formas Quadráticas 


Seção 18 


( ) As formas bilineares b e b*, que correspondem aos operado¬ 
res B e B* segundo o Teorema 18.2, definem a mesma forma 
quadrática cp(v) = b(v,v) = b*(v,v). 

( ) O operador auto-adjunto B:E-4Eea forma bilinear simétrica 
b:ExE-)K, que lhe corresponde conforme o Teorema 18.2, 
têm a mesma matriz relativamente a qualquer base de E. 


18 . 5 . A matriz de uma forma bilinear b: ExE na base U={u i,... ,u n } 
C E é dada por by = b(iii,Uj). Supondo conhecida a forma quadrá¬ 
tica cp: E —> R, como se pode obter a matriz de cp na base U a partir 
dos seus valores <p(v),veE? 

18 . 6 . Sejam f, g: E —> R funcionais lineares. Prove que a forma 
bilinear anti-simétrica f A g: E —> E, definida por (f A g)(u,v) = 
f(u)g(v) — f(v)g(u), é identicamente nula se, e somente se, um dos 
funcionais dados é múltiplo do outro. 

18 . 7 . Seja b: ExE-íM uma forma bilinear anti-simétrica no espaço 
vetorial E, de dimensão finita. Prove que as seguintes afirmações 
sobre b são equivalentes: 

(1) Tem-se b = f Ag, onde f,ge E*. 

(2) Existe uma base V = {vi,...,v n } C E tal que b(vi,Vj) = 0 se 

(b j} / {1,2}. 

Conclua que toda forma bilinear em R 3 é do tipo b = f A g. 
E em M 4 ? 

18 . 8 . Seja b: R 5 x R 5 —> R uma forma bilinear anti-simétrica. Prove 
que existem números cx, |3 e uma base {vi,v 2 ,v 3 ,v 4 ,v 5 } C R 5 tais que 
b(vi,v 2 ) = b(v 2) V]) = a, b(v 3 ,v 4 ) = -b(v 4 ,v 3 ) = (3 e b(v t ,Vj) = 0 nos 
demais casos. Conclua que existem funcionais lineares 
fi, f 2 , f 3 , f 4 : R 5 —> R tais que b = fi A f 2 + f 3 A f 4 . 

18 . 9 . Sejam E, E espaços vetoriais de dimensão finita, com produto 
interno. Estabeleça um isomorfismo natural entre B {E x F) e £(E;F). 
Determine a relação entre as matrizes de uma forma bilinear e da 
transformação linear que lhe corresponde. 
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18 . 10 . Dados os funcionais lineares f, g: E —» R, considere a forma 
bilinear f <g) g: E x E —> R (produto tensorial de f e g) definida por 
(f <8> g)(u,v) = f(u) ■ g(v). Prove as seguintes afirmações: 

(a) f ® g = 0 => f = 0 ou g = 0. 

(b) f®g = g<8)f^ um dos funcionais f, g é múltiplo do outro. 

(c) Se {f i ..., f n } cE*é uma base então as formas bilineares fi <8> fj 
constituem uma base de £>(E x E). 

(d) Nas condições do item (c), as formas fi • fj = ft <8> fj + fj <8> fi, com 
i < j, constituem uma base para o espaço das formas bilineares 
simétricas. 

(e) Com a notação de (c), as formas fi A f, = <S> fj — fj ® fi, com 
i < j, constituem uma base para o espaço das formas bilineares 
anti-simétricas. 

18 . 11 . Dada a forma quadrática cp: R 2 —> R, com cp(x,y) = 2x 2 —y 2 + 
3xy, ache uma base ortonormal {u,v} C R 2 e números À, p tais que, 
para todo vetor w = su + tv £ I 2 se tenha <p(w) = Às 2 + pt 2 . 

18 . 12 . Dada a matriz simétrica 


ache uma matriz ortogonal p tal que p T bp seja uma matriz diagonal. 
A partir daí obtenha uma base ortonormal {u, v} c R 2 tal que a forma 
quadrática cp : R 2 —> R, com cp(x, y) = 4x 2 + 2xy +2y 2 se escreva como 
cp(w) = Às 2 + pt 2 para todo vetor w = su + tv. 

18 . 13 . Dadas as formas quadráticas abaixo, use o método de La- 
grange para exprimi-las como somas e diferenças de quadrados e, a 
partir daí, determine o índice e o posto de cada uma delas: 


(a) 

<p(x,u) = 

= x 2 + 9y 2 + 6xy 

(b) 

= 

= x 2 + 8y 2 + 6xy 

(c) 

E(x,y,z) 

= x 2 + 2xy + z 2 — 3xz + y 2 — 2yz 

(d) 

í(x,y,z) 

= 8x 2 + 36yz — 6y 2 — 27z 2 — 24xy 
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18 . 14 . Dada a forma quadrática cp: M 2 —» M, com cp(x,y) = ax 2 + 
bxy + cy 2 , escreva-a como 


cp(x,y) = y 2 


a 



= y 2 [at 2 + bt + c], 



t = x/y, 


e use o trinômio at 2 + bt + c para obter condições sobre a, b, c que 
caracterizam se cp é positiva, negativa, indefinida, não-negativa ou 
não-positiva. 

18 . 15 . Seja A: E —> F uma transformação linear invertível. Para 
toda forma quadrática : F —> M, prove que cp = xj; o A: E —> R é uma 
forma quadrática em E, com o mesmo índice e o mesmo posto que x[>. 

18 . 16 . Prove que todo operador linear invertível A: M n —> M n trans¬ 
forma uma quádrica IcR n noutra quádrica de mesmo tipo. 




19 


Determinantes 


O determinante surgiu inicialmente nas fórmulas que exprimem a 
solução de um sistema determinado de n equações lineares a n in¬ 
cógnitas. Posteriormente, ele foi identificado como a área de um pa¬ 
ralelogramo ou o volume de um paralelepípedo e depois, de forma 
definitiva, como a função multilinear alternada da qual todas as ou¬ 
tras se deduzem. 

Tradicionalmente se tem o determinante de uma matriz quadra¬ 
da, ou de uma lista de vetores, que são as colunas (ou linhas) dessa 
matriz. Em Álgebra Linear, é mais apropriado falar do determinante 
de um operador linear. Seu interesse aqui decorre principalmente do 
fato de que um operador é invertível se, e somente se, seu determi¬ 
nante é diferente de zero. A partir daí, o determinante fornece um 
polinómio de grau n cujas raízes reais são os autovalores de um ope¬ 
rador num espaço vetorial n- dimensional (polinómio característico), 
polinómio esse que estudaremos na seção seguinte. 

Faremos aqui uma breve apresentação do conceito de determi¬ 
nante e de suas principais propriedades. Nosso ponto de partida são 
as funções multilineares, mais especificamente as alternadas. 

Em toda esta seção, E representa um espaço vetorial de dimensão 
n, no qual todas as bases que tomaremos serão ordenadas. 
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Uma forma r-linear no espaço vetorial E é uma função 
f: E x • • • x E —> R, 

definida no produto cartesiano E x • • • x E = E T , que é linear em cada 
uma das suas variáveis, isto é: 

f(v b ... ,Vi + V-, ... ,v r ) = f(vi,. . . ,Vi, ... ,v r ) + f(vi,... ,v[,. . . ,V T ), 
f(vi,...,0CVi,...,v T ) = af(v 1 ,...,v i , ...,v r ), 

para vi,..., vt, v- ..., v r € E e cx e R quaisquer. 

Se f é r-linear e um dos vetores vi,... ,v r é igual a zero então 
f(vi,...,v T ) = 0, pois 

f(- • • > 0,...) = f(..., 0.0,...) = 0.f(..., 0,...) =0. 

Teorema 19.1. Seja U = {ui ,..., u n } c E uma base. Para cada uma 
das u r listas ordenadas J = (ji,..., j r ) de inteiros compreendidos en¬ 
tre 1 e n, fixemos um número real aj = % j 2 ...j r . Existe uma, e somente 
uma, forma r-linear f: E x • • • x E —> R tal que f(uj,,..., iq r ) = aj para 
todo ] = j r ). 

Noutras palavras, uma forma r-linear f: E r —> M fica intei¬ 
ramente determinada quando se conhecem seus u T valores 
f(uj,,..., uj r ) nas listas de elementos básicos, e esses valores podem 
ser escolhidos arbitrariamente. 

Demonstração: Para facilitar a escrita, tomemos r = 3. O caso 
geral se trata igualmente. Suponhamos dado, para cada lista (i, j, k) 
de números naturais compreendidos entre 1 e n, um número real 
atjic. Definamos f:ExExE—> M pondo 

n 

f(u,V,w) = Y_ a ijkXiljjZ k , 
i,j,k=l 

se 

u«F XiUi, v = X yjUj e w = Y_ ZkUk. 

Verifica-se facilmente que f, assim definida, é trilinear e que 
f(Ui, Uj,uic) = atj k . Além disso, seg:ExExE—>Mé trilinear e 
g(ui, Uj, u k ) = atjic para í, j, k = 1 ,..., n quaisquer, então para 

u = ^ xtUi, v = UjUj e w = ^ zicUic. 
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arbitrários, tem-se 

g(u,v,w) = g(^ XiUi, Y_ yjUj, ^ z k u k ) 

= Y x iVi z k g(Uí,Uj,Ulc) 

= Y. a i)^iV]Z-k = f(u,v,w), 

logo tj r. ip: 

Corolário. O espaço vetorial £ r (E;R) das formas r-lineares 
f: E x ■ ■ ■ x E —> M tem dimensão n r . 

Com efeito, uma vez fixada a base U c E, o Teorema 19.1 faz 
corresponder, biunivocamente, a cada f € £ r (E;M) os u T números ctj. 
Isto determina um isomorfismo entre £ T (E;M) e M n '. □ 

Uma forma r-linear f: E x • • • x E —> R chama-se alternada quando 
f(vi,...,v T ) = 0 sempre que a lista (vi,...,v r ) tiver repetições, ou 
seja, quando 

f(v 1 ,...,V i _ 1 ,V,V í+1 ,...,Vj_ 1 ,V,Vj +1 ,...,V T ) = 0 
para quaisquer v, vi,..., v r € E. 

Teorema 19.2. Uma forma r-linear f: E x • • • x E —> Ré alternada 
se, e somente se, é anti-simétrica, isto é, 

f(Vi,...,Vi, ...,Vj,...,V r ) = -f(v 1 ,...,Vj,...,V i ,...,V r ) 

para quaisquer vi,..., v T G E. 

Demonstração: Por simplicidade, escrevamos 

f(vi,...,u,...,v,...,v r ) = (p(u,v). 

Então, f alternada implica cp(u,u) = cp(v,v) = tp(u + v,u + v) = 0, 
logo 

0 = cp(u + v,u +v) = cp(u,u) + cp(u,v) + tp(v,u) + cp(v,v) 

= cp(u,v) + (p(v,u), 

portanto qj(u,v) = — cp(v,u), de modo que f é anti-simétrica. Re¬ 
ciprocamente, se f é anti-simétrica então tp(v,v) = — cp(v,v) logo 
2tp(v,v) =0, cp(v,v) = 0 e f é alternada. □ 
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Corolário. Seja f: E x • • • x E —> R r-linear alternada. Para toda per¬ 
mutação o dos inteiros 1,2,..., r, e toda lista de vetores vi,..., v r € E 
tem-se 

f(v ff (iV ff(r) ) = £(J f(vi, ... ,v T ), 

isto é, 

fkj (1 v ff(r) ) = if (vi) .. . ) v r ), 

onde o sinal é + se a é uma permutação par e — se a é uma per¬ 
mutação ímpar. (Vide Apêndice.) 

Com efeito, passa-se da seqüência (vi,... ,v T ) para (v^q,v CT ( T )) 
mediante k transposições sucessivas, que correspondem a k mudan¬ 
ças de sinal no valor de f. Como e CT = (—1 ) k , o corolário segue-se. □ 

A notação *4 r (E) indica o espaço vetorial das formas r-lineares 
alternadas f: E x ■ ■ • x E —> M. 

Exemplo 19.1. Dados os funcionais lineares E —> R, a 

função f: E x • ■ ■ x E —i M, definida por 

f(vi,...,V r ) — f! (V!) • f 2 (v 2 ) • ■-fr(v r ) 

é uma forma r-linear, chamada o produto tensorial dos funcionais 
lineares fq..., f T . 

Exemplo 19.2. Todo funcional linear f: E —> R é uma forma 1-linear 
alternada, já que não é possível violar a condição de anti-simetria. 
Portanto A] (E) = E*. 

Exemplo 19.3. Qualquer aplicação r-linear f: R x • • • x R —> R é do 
tipo f(ti,..., t r ) = a • ti • t 2 • • • t T , onde a = f(1,..., 1). (Vide Teorema 
19.1.) Quando r > 1, f só pode ser alternada quando a = 0. Logo 

= {0} se r > 1. 

Exemplo 19.4. A forma f : R 2 x I 2 -) 1, definida por f (u, v) = xiy 2 — 
x 2 yi quando u = (xqx 2 ) e v = (yi,y 2 ), é bilinear alternada. Se 
g:l 2 xl 2 -) lé qualquer outra forma bilinear alternada em M 2 
então, pondo c = g(eq e 2 ), vem: 

g(u,v) = gfoej +x 2 e 2 ,y 1 e 1 +y 2 e 2 ) 

— xiyig(eq eO + xiy 2 g(eq e 2 ) 

+ x 2 yig(e 2 ,ei) + x 2 y 2 g(e 2 , e 2 ) 

= (xiy 2 -x 2 y 1 )g(e 1 ,e 2 ) 

= c • (xiy 2 -x 2 y0 = c • f(u,v) 
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pois g(e b ei) = g(e 2 ,e 2 ) = 0 e g(e 2 ,ei) = -g(ei,e 2 ). Isto mos¬ 
tra que toda forma bilinear alternada g é um múltiplo de f, logo 
dim .4, 2 (M 2 )=1. 

Teorema 19.3. Seja f: E x • • • x E —> R r-linear alternada. Se os 
vetores vi,..., v T forem L.D. então f (vi,..., v T ) =0. 

Demonstração: Isto é claro se vi = 0. Caso contrário, um dos 
vetores, digamos v í; é combinação linear dos anteriores: 



Então 




pois f é alternada. 


□ 


Corolário 1. Se existe uma forma r-linear alternada f: E x • • • x 
E —> R tal que f(vi,...,v r ) / 0 então os vetores vi,...,v r € E são 
linearmente independentes. 

Corolário 2. Se r > dim E então *4. r (E) = {0}. 

Com efeito, sendo r > dim E, quaisquer r vetores vi,... ,v T são 
linearmente dependentes, logo f(v 1 ,...,v T ) = 0 para todo f € A r e 
todos vi,... ,v r € E. □ 

A partir de agora, concentraremos nosso interesse nas formas 
n-lineares alternadas, f € .4 n (E), onde n = dim E. O resultado fun¬ 
damental é o teorema seguinte e, principalmente, seu Corolário 1. 

Teorema 19.4. Seja U => {ui,..., u n } uma base de E. Dado arbitra¬ 
riamente um número real a, existe uma única forma n-linear alter¬ 
nada f: E x ■ • • x E —> M tal que f(ui,... ,u n ) = a. 

Demonstração: Suponhamos inicialmente que exista f € *4. n (E) tal 
que f(ui,..., u n ) = a. Se g G „4. n (E) for tal que g(ui,..., u n ) também 
é igual a a, então para toda lista de vetores ui,,..., ut n e U tem-se: 


g(uq,..., u in ) = 0 = f(ui,,...,uij, 
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se houve repetições na lista; 

g(u in ...,u in ) = g(u ff(1 u ff(n) ) 

= 

= £ a f(ui,...,u n ) 

= ffUi, , . . . , Ui,,) 

se (ti,...,i n ) = (cr(lu(u)) for uma permutação dos inteiros 
(1,..., n), isto é, se não houver repetições na lista. Segue-se então 
do Teorema 19.1 que f = g. Portanto a forma n-linear alternada f 
fica determinada por seu valor f(ui,..., u n ). 

Isto nos indica como obter uma forma n-linear alternada 
f: E x • • • x E —> M tal que f(ui,...,u n ) = a. Para toda lista or¬ 
denada (ii,..., i n ) de inteiros compreendidos entre 1 e n, poremos 
ffuq,..., u in ) = 0 se houver repetições na lista, ft/uq,..., u ín ) = 
a se (íi,...,i n ) for uma permutação par dos números 1,2, ...,u e 
f(uq,..., uqj = —a se a lista ii,..., i n for uma permutação ímpar 
dos números 1,2,..., n. Pelo Teorema 19.1, há uma única forma u- 
linear f: E x • • • x E —> R com estas propriedades. Resta provar que f é 
alternada. Com esse objetivo, tomamos um vetor v = IxtUi qualquer. 
Então: 


n 

f(*V * V*) = XiXj f(*Ui * Uj*) 

y=i 

= ^ XiXi.f(*Ui * tq*) + ^ xpCjf (=toq * Uj*) 
i i<j 

+ ^ XiXjf(*Ui * Uj*) 

i>j 


m 

0 + 

y~ xiXjt(*u^ * 

Uj*) - 

y~ x t xj t (*uj * 

Ui*) 



i<) 


i>j 


( 2 ) 

L 

XiXjf (*Ux * Uj* 

1 

M 

XjXif (*Ui. * Uj*) 



i<) 


i<) 



( 3 ) 

L 

XpCjf (*U t * Uj* 

1 

M 

X|Xjf (*u^ * Uj*) 

= 0 . 


i<) 


i<j 
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Acima, os asteriscos estão em lugar de u — 2 vetores que perma¬ 
necem fixos durante a argumentação. A igualdade (1) usa o fato de 
que f(*Uj.*Uj*) é uma função (n —2)-linear desses vetores, que satis¬ 
faz a condição f (*ui * u,*) = — f(*u, * iq*) quando esses n — 2 vetores 
pertencem à base U logo, pelo Teorema 19.1, esta igualdade vale em 
geral. Segue-se que f(*Ui*iq*) = 0. Na igualdade (2) foram trocados 
os nomes dos índices mudos i, j. Finalmente, a igualdade (3) usa 
apenas que XiXj = XjXj.. □ 

Corolário 1. Se dim E = n então dim A n (E) = 1. 

Com efeito, fixada a base U = {ui,..., u n } c E, existe f e A n (E] 
tal que f(ui, ...,u n )=l. Então, para toda geA n (E), se g(ui, ...,u n ) = a 
tem-se também (af) (ui,..., u n ) = a, logo g = af. Portanto, {f} é uma 
basedeA n (E). □ 

Corolário 2. Se {ui,..., u n } c E é uma base e 0 / f G A n (E) então 
f(ui,...,u n ) / 0. 

Com efeito, pelo Teorema 19.4 existe f Q € A n (E) tal que 
f 0 (ui,... ,u n ) = 1. Pelo Corolário 1, f = af 0 , com a ^ 0. Logo 

f(u],..., u n ) = afju!,..., Un) = a / 0. Ql 

Toda transformação linear A: E —> E induz uma transformação 
linear A # : A n (E) —> A n (E), a qual faz corresponder a cada forma n- 
linear alternada f: E x • • • x E —> M a nova forma A # f: E x • • ■ x E -> 1, 
definida por 

(A # f)(v 1 ,...,v n ) = f(Av 1 ,...,Av n ), 

onde vi,... ,v n G E. É fácil verificar que realmente A # f € -4 n (E), que 
(BA) # = A # B # e I # = I. Se A for um isomorfismo, A # também será, 
com (A # ) _1 = (A _1 ) # . 

Seja agora A: E —> E um operador linear. 

Como dim A n (E) = 1, o operador linear A # : A n (E) —> A n (E) con¬ 
siste na multiplicação por um número real, que chamaremos o deter¬ 
minante do operador A: E —> E e indicaremos com a notação det A. 
Assim, por definição, A # f = det A • f, isto é, 

f (AV!,..., Av n ) = det A • f (vi,..., v n ) 

para toda f: E x • • ■ x E —> M n-linear alternada e quaisquer vi,..., 
v n € E. 
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Isto define o determinante de um operador de modo intrínseco, 
sem recurso a bases ou matrizes. A seguir mostraremos como obter, 
a partir desta definição, as formas clássicas de apresentar o determi¬ 
nante. De imediato, veremos como é fácil provar duas propriedades 
cruciais do determinante. 

Teorema 19.5. Se A,B: E —> E são operadores lineares então 
det(BA) = det B • det A. 

Demonstração: Sejam {vi,... ,v n } c E uma base e 0 / f £ á n (E), 
logo f (vi,..., v n ) / 0. Então 

det(BA).f(vi,... ,v n ) = f(BAvi,..., BAv n ) 

= det B.f (Avi,..., Av n ) 

= det B. det A.f(vi,... ,v n ), 


portanto det(BA) = det B • det A. □ 

Corolário. Se A: E—>E é um operador não-negativo então det A>0. 

Com efeito, existe B: E—>E tal que A=B 2 , logo det A=(det B) 2 >0. 

□ 


O teorema abaixo mostra que det A > 0 quando A é positivo. 

Teorema 19.6. O operador linear A: E —) E é invertível se, e somente 
se, det A / 0. No caso afirmativo, tem-se det(A _1 ) = (det A) -1 . 

Demonstração: Se existe A -1 , então de AA _1 = I resulta 

det A. det(A -1 ) = det(AA _1 ) = det 1 = 1, 

logo det A / 0 e det(A _1 ) = (det A) -1 . Reciprocamente, se det A / 
0 então, tomando uma base {vi,..., v n } C E e uma forma n-linear 
alternada não-nula f: E x • • • x E —> M temos 

f (Av],..., Av n ) = det A.f (v],..., v n ) / 0, 

logo, pelo Corolário 1 do Teorema 19.3, os vetores Avi,..., Av n cons¬ 
tituem uma base de E. Assim, A é invertível. □ 

Corolário. O sistema de equações lineares Ax = b, com A e £(M n ), 
possui uma única solução se, e somente se, det A / 0. 
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Definamos, a seguir, o determinante de uma matriz quadrada. 
Dada a € M(u x n), escreveremos, de agora em diante, a = 
[vi,..., v n ] para significar que vi,..., v n são os vetores-coluna da 
matriz a. Seja A: M n —> M n o operador linear cuja matriz na base 
canônica de M n é a, ou seja, Ae] = V],..., Ae n = v n . 

Por definição, o determinante da matriz a é igual a det A. 

Assim, se f Q € A n (M n ) é a forma u-linear alternada tal que 
f 0 (ei,..., e n ) = 1 (vide Teorema 19.4) então 


det a = det A = det A.f 0 (ei,..., e n ) = f 0 (Aei,..., Ae n ), 


ou seja: 


det a = f 0 (vi,...,v n ). 


Portanto det: M(nxn)-)Méa única função vAinear alternada 
das colunas da matriz a = [vi,..., v n ] que assume o valor 1 na matriz 
identidade I n . 

Para uma qualquer função u-linear alternada f(a) = f(vi,..., 
v n ) das colunas da matriz a = [vi,...,v n ], tem-se evidentemente 
f(a) = f(vi,... ,v n ) = c • det a, onde c = f(I n ) = f(ei,..e n ). 

Escrevemos det[vi,... ,v n ] para indicar o determinante da ma¬ 
triz cujas colunas são os vetores vi,..., v n € M n . A afirmação acima 
destacada é a caracterização axiomática dos determinantes feita por 
Weierstrass. Segundo ela, todas as propriedades dos determinantes 
podem, em princípio, ser deduzidas das seguintes: 

1) det[... ,vi + Wi,...] = det[... ,vt,...] + det[... ,wi,...]; 

2) det[..., avt,...] = a ■ det[..., v t ,...]; 


3) det[..., vi,..., vj,...] = — det[... 



4) det[ei,...,e n ] = 1. 

Por exemplo, vale: 

5) O determinante de uma matriz não se altera quando se soma a 
uma de suas colunas uma combinação linear das demais. 



Seja 


254 Determinantes 


Seção 19 


A afirmação acima significa que 

det[vi,...,vt + w, ...,v n ] = det[v 1 ,...,v i , ...,v n ], 

o que é claro pois a segunda parcela do segundo membro abaixo é 
zero, pelo Teorema 19.3: 

det[..., vt + w,..., ] = det[..., v t ,...] + det[..., w,...]. 

Como aplicação de 5) temos o 

Exemplo 19.5. O determinante de uma matriz triangular é igual 
ao produto dos elementos de sua diagonal. Com efeito, seja t = [ty] € 
M(u x n) triangular superior. Escrevendo t = [vi,... ,v n ], temos 

vi = tnd, 

V2 = t 12 ei + t 22 e 2 , 

v 3 = ti3 e i + t 2 3c 2 + t 33 e 3 , etc. 


Portanto 


det t = det[tnei,v 2 ,...,v n ] 

= tn det[e!, t 12 ei + t 22 e 2 , v 3 ,...] 

= tnt 22 det[ei, e 2 , ti 3 ei + t 23 e 2 + t 33 e 3 , V 4 ,...] 
= tnt 22 t 33 det[e!, e 2 , e 3 ,v 4 ,...]. 

Prosseguindo analogamente, chegamos a 

det t = tnt 22 ...t nn . 


Dos Teoremas 19.5 e 19.6 resulta que det(ba) = det b • det a 
e que det a / 0 se, e somente se, existe a -1 . No caso afirmativo, 
det(a _1 ) = (det a) -1 . 

Exemplo 19.6. (Regra de Cramer.) Seja a € M(u x n) uma matriz 
invertível. Dado b et n , indiquemos com 0 símbolo a[i;b] a matriz 
obtida de a quando se substitui sua i-ésima coluna por b. A solução 
do sistema linear ax = b, de n equações a n incógnitas é 0 vetor 
x = (xi,..., x n ) cujas coordenadas são 


Xi = 


det a[i;b] 


i 1 ,..., 


det a 


n. 



Seção 19 


Determinantes 255 


Com efeito, se a = [vi,...,v n ], a igualdade ax = b significa que 
b = x-ivi H-1- x n v n . Assim, para cada i de 1 até u, tem-se 

det a[i; b] = det[vi,..., b,..., v n ] 

n 

= Xk det t Vl ) • ■ • > Vk, . . • , V n ] 

k=1 

= xí • det[vi,... ,v n ] 

= xí • det a. 

pois, quando k / i, a matriz [vi,... ,Vk,... ,v n ], com v k na i-ésima 
coluna, tem duas colunas iguais a v k , logo seu determinante é zero. 
Segue-se então que xí = det a[i;b]/det a. 

Se a e a' são matrizes do mesmo operador A em relação a bases 
diferentes então a! = p 1 ap, onde p é a matriz de passagem de uma 
base para a outra. Portanto 

det a' = (det p)^ 1 • det a • det p = det a. 

O teorema seguinte completa esta observação, mostrando que o 
determinante de todas essas matrizes é igual a det A. 

Teorema 19.7. O determinante do operador linear A: E —> E é igual 
ao determinante de uma matriz de A numa base qualquer de E. 

Demonstração: Seja a = [aq] € M(u x n) a matriz de A numa 
base U c E. Por definição, det a = det A 0 , onde A 0 : R n —> M n é o 
operador cuja matriz na base canônica de M n é a. Seja (p: E —> M n 
o isomorfismo que transforma U na base canônica de M n . Para cada 
Uj € U, tem-se Auj = ^ aijiq, logo 

<p(Auj) = Y_ QijVlUi) = X. Qi ' eí = A ° e > = 

í i 

Segue-se que cp • A = A 0 • cp, ou seja, A 0 = cp • A • (p _1 . Portanto, para 
cada f € A n (M n ) tem-se 

det a • f = Apf = ((p*)” 1 A # cp # f = ((p # ) _1 • det A • cp # f = 

= det A • (q/)^ 1 cp # f = det A • f. 


Assim, det a = det A. 


□ 
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Tradicionalmente, o determinante de uma matriz a = [ay] € 
M(n x n) é definido como a soma de n! parcelas do tipo 


=*= a ljl a 2h ' ' ' a nj n - 


Essas parcelas são produtos de n fatores que pertencem a linhas 
e colunas diferentes de a. A ordem em que os fatores são dispostos 
é a ordem crescente dos índices 1,2,..., n das linhas. Os segundos 
índices (das colunas) exibem uma permutação a = dos 

inteiros 1,2, O sinal que precede cada parcela é + ou —, 

conforme a permutação a seja par ou ímpar respectivamente. Nou¬ 
tras palavras, a definição clássica do determinante é 



a 


o somatório sendo estendido a todas as permutações o dos inteiros 
1,2,..., n, com e ff = 1 se cr é par e £ ff = —1 se cr é ímpar. 

Para obter esta expressão, consideremos mais uma vez a forma 
f 0 <E Ai(K n ) tal que f 0 [e h ..., e n ) = 1, logo f 0 (e a(1) ,..., e ff(n) ) = 
para toda permutação cr dos inteiros 1,2,..., n. 

Dada a matriz a = [ay] = [vi,..., v n ] € M(n x n), temos 


n 



n 



n 



logo 


det a = f 0 (vi,... ,v n 



n 



li > '*■'12 > * • 
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Neste último somatório, são nulas as parcelas em que há repeti¬ 
ções entre os índices ii, Í 2 ,..., i n , restando apenas aquelas em que 

= (p(l),p(2),...,p(n)) 

é uma permutação dos inteiros 1,2,..., n. Neste caso, 

Q-i-l 1 ' Q-í. 22 ‘ ‘ Qá n n ' Q-2 (j( 2) ' • • • ' Q-ru7(n)> 

onde cr = p 1 e a parcela correspondente é igual a 

’ A2cr(2) ' " • ' ^ruyfnj^O> • • • j ^p(n))- 

Por conseguinte, levando em conta que e ff = e p , tem-se: 

det a ) ' < ^2cr(2) ' • • • ' druj(n) > (*) 

cr 

o somatório sendo estendido a todas as permutações cr dos intei¬ 
ros 1,2,... ,n. 

Voltando à expressão anterior (*), podemos escrever 

det a ) É-pdpCI)! ' 0 -p( 2)2 • • • ^pfnjn ■ 

p 

Esta igualdade mostra que o determinante da matriz a é igual 
ao determinante da sua transposta a T . 

Se A: E —> E é um operador num espaço vetorial munido de pro¬ 
duto interno e a é sua matriz numa base ortonormal então 

det A = det a = det a r — det A*. 

Resulta da igualdade det a = det a T que o determinante é 
uma função n-linear alternada das linhas da matriz a € M(n x n). 
(A única tal que det I n = 1.) Como no caso de colunas, uma qual¬ 
quer função n-linear alternada f das linhas da matriz a é da forma 
f(a) = c • det a, onde c = f(I n ) = f(ei,..., e n ). 

Outra conseqüência da igualdade det A = det A* é que o deter¬ 
minante de um operador ortogonal A é igual a ±1, pois 


(det A) 2 = det A* • det A = det(A*A) = det 1 = 1. 
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O teorema seguinte utiliza, em sua demonstração, a caracteriza¬ 
ção do determinante de uma matriz como função multilinear alter¬ 
nada das linhas ou das colunas dessa matriz. 

Teorema 19.8. Se b € M(r x r), c € M(rx (n—r)), 0 € M((n —r) x r) 
e d G M((u — r) x (n — r)) então o determinante da matriz 


a = 


b c 
0 d 


€ M(u x n) 


é igual a det b • det d. 
Demonstração: Para cada c fixa, 

f(b, d) = det 


é uma função r-linear alternada das colunas de b e (n - r)-linear 
alternada das linhas de d, logo 


det 


b 

0 


c 

d 


= det b • f(I r , d) 

= det b ■ det d • f (I T , I n - T ) 
= det b • det d, 


pois 


f(Ir,In 


= det 


I, c 

0 In—r 


= 1 , 


já que o determinante de uma matriz triangular é o produto dos 
elementos da sua diagonal. □ 


O Teorema 19.8 implica imediatamente uma sua versão mais ge¬ 
ral, onde se tem uma matriz triangular por blocos, por exemplo, do 
tipo 


b c 
e 


d 

f 

g 


Aí, b, e, g são matrizes quadradas (de ordens possivelmente diferen¬ 
tes) e b, c, d têm o mesmo número de linhas, assim como e, f. Além 
disso, d, f, g têm o mesmo número de colunas, assim como c, e. Os 
lugares em branco são ocupados por zeros. 
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Nestas condições, det a = det b ■ det e • det g. 

Dada a = [ay] € M(n x n), indicaremos com a notação My 
a matriz de ordem (n — 1 ] x (n — 1) obtida mediante a omissão 
da i-ésima linha e da j-ésima coluna da matriz a. O ij -ésimo me¬ 
nor de a é, por definição, o determinante det My o qual se chama 
também o menor relativo ao elemento ay. 

Resulta imediatamente do Teorema 19.8 que se a = [ei,v 2 , 
v n ] é uma matriz cuja primeira coluna é (1,0,..., 0) então det a = 
det M] i. Segue-se que se a = [et, v 2 ,..., v n ] então 

det a = det M n = (-l) í+1 det M tl 

pois este caso se reduz ao anterior mediante i — 1 transposições de 
linhas. Portanto, dada a = [ay] = [vi,... ,v n ], com 

vi = Y O-i! e u 

í 

tem-se 

det a = a n det[ei,v 2 ,... ,v n ], 

í 

logo 

det a = ^(—1) 1+1 an det Mu . 

i 

A fórmula acima, chamada o desenvolvimento de det a segundo 
a primeira coluna, reduz o cálculo do determinante de sua matriz 
n x n ao de n determinantes de matrizes (n — 1) x (u — 1 ]. 

Mais geralmente, podemos fixar um inteiro arbitrário j, com 
1 < j < n, e efetuar o desenvolvimento do determinante de a se¬ 
gundo a j-ésima coluna. Para isso, observamos que se 

a = [vi,...,Vj_ 1 ,e i ,Vj+ 1 ,...,v n ] 

é uma matriz cuja j-ésima coluna é então det a = (—1 ] 1+ ^ det My, 
pois a pode ser transformada numa matriz cuja primeira coluna é ei 
mediante i — 1 transposições de linha e j — 1 transposições de coluna, 
o que provoca i + j — 2 mudanças de sinal em seu determinante, e 
isto é o mesmo que multiplicá-lo por (—1 ) 1+ h 
Assim, dada a = [vi,..., v n ], com 

v ] = J_ o-ijei, 

í 
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temos 

det a = a-ij det[v 1 ,...,vj_i,e i ,vj+i,...,v n ], 

i 

o que fornece: 

n 

det a = ^(—1 ) l+ ^ ai, det My . 

i=i 

Este é o desenvolvimento do determinante de a segundo a yésima 
coluna. 

Como o determinante de a é igual ao de sua transposta a T , vale 
uma fórmula análoga, que é o desenvolvimento segundo a i-ésima 
linha : 

n 

det a = ^(—1 ) 1+ ’ atj det Mtj. (*) 

j=i 

Estas fórmulas são úteis nos cálculos, principalmente quando se 
escolhe uma linha ou uma coluna com diversos elementos iguais a 
zero. Elas também podem ser usadas como ponto de partida para 
uma definição indutiva do determinante de uma matriz. 

Resulta da fórmula (*) que, para quaisquer i, j = 1,..., n, temos 

n 

Y_ (-1 ) j+k aik det Mjk = (det a) • ôy , (**) 

k=1 

ou seja, este somatório, é igual a det a quando i = j e igual a zero 
quando i / j. Com efeito, o caso i = j é simplesmente a fórmula 
(*) e, para i / j, o somatório acima é o desenvolvimento, segundo a 
j-ésima linha, do determinante de uma matriz a na qual as linhas i 
e j são iguais, portanto seu determinante é zero. 

O primeiro membro da igualdade (**) lembra um produto de 
matrizes. De fato, podemos introduzir uma matriz adj a, cha¬ 
mada a adjunta clássica de a, pondo, para i, j = 1,..., n, (adj a)q = 
(—l) 1+ j det Mji. Então o primeiro membro da igualdade (**) é o ij- 
ésimo elemento do produto a • adj a, enquanto o segundo membro é 
o ij-ésimo elemento da matriz (det a).I n . Portanto, a igualdade (**) 
significa que 


a • adj a = (det a) • I n . 
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Segue-se daí que se a matriz a é invertível (isto é, se det a / 0) 
então sua inversa se exprime como 


a 


-i 


1 

det a 


adj a. 


Esta fórmula para a 1 também pode ser obtida com auxílio da 
Regra de Cramer. Com efeito, o problema de obter uma matriz a 1 = 
[wi,..., w n ] tal que aa 1 = I n pode ser considerado como n sistemas 
de equações lineares a • Wj = ej (j = 1,..., n). Pela Regra de Cramer, 
a solução Wj = (xq,... ,x n j) de cada um desses sistemas é dada por 


det a[i; ed 
Xli = det a 


det Mjt, 


pois a[i;e,] = [v l5 ... ej,v i+ i,... ,v n ] se a = h,...,v n ]. 

Uma submatriz da matriz a € M(m x n) é uma matriz obtida a 
partir de a pela omissão de algumas de suas linhas e/ou colunas. 
Mais precisamente, dois subconjuntos 


R = (ii < • • • < i r } C {1,2,..., m} 


e 

S = (ji < ••• < jslC (1,2, ...,n} 

determinam a submatriz aRs = [ai a j p ] € M(r x s) da matriz a, obtida 
pela omissão das linhas de a cujos índices não pertencem a R e das 
colunas cujos índices não estão em S. 

Teorema 19.9. O posto de uma matriz a € M(m x u) é o maior 
número r tal que a possui uma submatriz a R $ € Mjr x r), com 
det a RS / 0. 

Demonstração: Seja r o posto de a = [vi,... ,v n ]. Existe S = (ji < 
■■ ■ < jrl C {1,2,..., n} tal que {v, 1 ,..., Vj r } é L.I., portanto a matriz 
[vj,,..., Vj T ] € M(m x r) tem posto r. Como o posto segundo linhas é 
igual ao posto segundo colunas (Teorema 8.2), existe um subconjunto 
R = {li < ■ ■ • < í r } C {1,2,..., m} tal que as linhas de [vq,..., vj r ] cujos 
índices pertencem a R são L.I.. Isto significa que a matriz quadrada 
a RS € M(r x r) é invertível, logo det a R s / 0. Mas é claro que o 
posto de uma submatriz de a é menor do que ou igual ao posto de 
a. Portanto, nenhuma submatriz k x k de a, com k > r, pode ter 
determinante / O. □ 




262 Determinantes 


Seção 19 


Na Seção 17 (vide Observação no final de 17.G) foi provado que 
uma matriz simétrica é positiva se, e somente se, seus pivôs são 
todos positivos. Usaremos agora determinantes para provar outro 
critério de positividade de uma matriz, o qual é tradicional e ele¬ 
gante porém em dimensões mais altas é muito menos prático do que 
o teste dos pivôs. 

Para cada k = 1,..., u o menor principal de ordem k da matriz 
a = [ay] € M(n x n) é o determinante da submatriz principal ak = 

[a-ij], 1 < i,j < k. 

Teorema 19.10. A fim de que uma matriz simétrica a = [ay] € 
M(u x n) seja positiva é necessário e suficiente que seus menores 
principais sejam todos positivos. 

Demonstração: No início de 17.G. viu-se que se a é positiva então 
suas submatrizes principais ak são positivas, logo det ak > 0 para 
k = 1,..., n. Suponha, reciprocamente, que todos os menores prin¬ 
cipais sejam positivos. Tomando a decomposição a = lu (veja item 
5-em 17.F), resulta que ak = lkUk, para k = 1,..., n, U e Uk indicam 
as submatrizes principais k x k de 1 e u respectivamente. Segue-se 
do Exemplo 19.5 que det U = 1, pois todos os elementos da diagonal 
de lk são iguais a 1. Logo det ak = det(lkUk) = det Uk = U 11 U 22 ... Ukk 
(produto dos elementos da diagonal de Uk). Portanto un = det ai > 
0 e Ukk = det ak/ det ak-i > 0 para k = 2, ..., n. Assim todos os pivôs 
Ukk da decomposição a = lu são positivos, logo a matriz simétrica a 
é positiva. □ 


Apêndice 

Uma permutação dos inteiros 1,2, ...,u é uma bijeção a: J n —* J n , 
onde J n — {1,2,..., n). Um exemplo particular de permutação, quan¬ 
do n > 1, é dado pelas transposições. Uma transposição t: J n —> Jn 
é definida fixando-se dois elementos i / j em J n , pondo t(í) = j, 
t(j ) = í e T(k) = k se k (i, j}. 

Se a, cr 7 : J n —> J n são permutações então a função composta a o 
cr': J n —> J n também é uma permutação, chamada o produto das 
permutações o e o' e indicada pela notação cr cr'. A inversa o -1 : J n —» 
J n de uma permutação é ainda uma permutação, caracterizada pelo 
fato de que era -1 = a -1 cr = i n = permutação identidade J n —> Jn- Se 
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t é uma transposição então tt = t n , ou seja, t = t . 

Às vezes se representa uma permutação o: J n —> J n pela lista 
ordenada (o(1cr(n)) dos valores que ela assume nos números 
1,2,..., n. 

O conjunto das permutações dos n números 1,2,..., n tem 
n! = 1 • 2... n elementos. 

Toda permutação o: J n —> J n se escreve (de várias maneiras dife¬ 
rentes) como produto de transposições o = ti ■ T 2 ... t*. 

Dada a permutação o, o número k de transposições tais que 
o = ti ■ T 2 ... Tic pode variar, porém não a sua paridade. Noutras 
palavras, se o puder ser expressa como produto de um número par 
de transposições então não poderá ser expressa como produto de um 
número ímpar de transposições. Ou ainda, se o = ti -T 2 ... onde as 
Ti são transposições então (—1 ) k é um número que depende apenas 
de cr. Este número, igual a ±1, é representado pela notação e a . 

Quando e ff = +1, diz-se que cr é uma permutação par. Se 
£(j = —1, diz-se que cr é uma permutação ímpar. Tem-se = e a -e a >, 
ou seja, o produto de permutações pares é par, o produto de uma 
permutação par por uma permutação ímpar é ímpar e o produto de 
duas permutações ímpares é par. E claro também que e a = e ff -i. 


Exercícios 


19.1. Sejam Ei ,..., E r espaços vetoriais de dimensões ui,..., n r res¬ 
pectivamente. Defina função r-linear f:E] x ■ ■ • x E r —) te prove 
que o conjunto £(Ei,..., E r ;R) dessas funções é um espaço vetorial 
de dimensão uj • U 2 • ... • n r . 


19.2. Sejam E um espaço vetorial de dimensão n e U = (ui,..., u n } C 
E uma base. Para cada seqüência crescente J = {ji < )i < ■ ■ ■ < j r } de 
r inteiros de 1 até n, seja escolhido um número aj. Prove que existe 
uma (única) forma r-linear alternada f : E x ■ • • x E —> R tal que 
f(uj,,... ,Uj r ) = aj para toda seqüência J = {ji < • ■ ■ < j T }. Conclua 
que o espaço vetorial *4. r (E) t em dimensão igual a (^). 
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19.3. Dados os funcionais lineares f i,..., f T : E —> R, defina a forma 
r-linear alternada f = fi A...Af r : E x • • • x E —> M pondo f (vi,..., v r ) = 
det(fi(Vj)). (“Produto exterior” dos funcionais fi,... ,f r .) Prove que 
fi A ... A f r / 0 se, e somente se, fi,..., f T são L.I.. Prove também 
que se {fi,..., f n } cE*é uma base então as formas f j = fj, A... A fj T , 
para todo J = {ji < ■ ■ ■ < j r } C (1,2,... ,n}, constituem uma base para 

A (E). 

19.4. Chama-se gramiano dos vetores vi, V 2 ,..., v k e M n ao número 

y(vi,...,v k ) = det((vi,Vj)), 

determinante da matriz de Gram g(vi,..., v k ). Prove: 

(a) y(vi,... ,vic) > 0 se, e somente se, os vetores vi,...,v k são line¬ 
armente independentes. 

(b) Se vi é perpendicular a V 2 ,... ,v k então y(vi,... ,v k ) = |vi| 2 - 
y(v 2 ,...,v k ). 

19.5. Com a notação do exercício anterior, sejam wi a projeção or¬ 
togonal do vetor vi sobre o subespaço gerado por v 2 ,... ,v T e hi = 
vi — wi, logo hi é perpendicular aos vj com 2 < j < r. Prove que 
y(vi,...,v r ) = |hi| 2 y(v 2 , ...,v T ). 

19.6. O paralelepípedo gerado pelos vetores linearmente indepen¬ 
dentes vi,..., v T € M n é o conjunto P[vi,..., v T ] das combinações line¬ 
ares tiví + • • • + t r v r , onde 0 < ti < 1. O volume (r-dimensional) do 
paralelepípedo é definido por indução. Se r = 1, ele se reduz ao seg¬ 
mento de reta [0,vi], cujo “volume” uni-dimensional é, por definição, 
|vi|. Supondo definido o volume de um paralelepípedo de dimensão 
r — 1, põe-se 


vol P[v 1 ,...,v r ] = Ihil • volP[v 2 , ...,v r ], 

onde |hi | é a altura do paralelepípedo, isto é, hi = vi - wi e wi é 
a projeção ortogonal de vi sobre o subespaço gerado por v 2 ,... ,v r . 
Prove que 


VOl P [v !, . . . , V T ] = \/y(vi,...,V T ) = ^/detAy vj) ). 
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19.7. Seja a a matriz quadrada invertível cujas colunas são os veto¬ 
res vi,... ,v n € M n . Prove que y(vi,...,v n ) = (det a ) 2 e conclua que 
o paralelepípedo gerado pelos vetores vi,..., v n tem volume igual a 
| det a|. 

19.8. Seja A: R n —> M n um operador linear invertível. Para todo 
paralelepípedo n-dimensional X c M n , prove que a imagem A(X) é 
um paralelepípedo tal que vol A(X) = | det A| • volX. 

19.9. Calcule o determinante da matriz 


0 

0 

0 

014 

0 

0 

023 

024 

0 

032 

033 

034 

.041 

042 

043 

O44 


e generalize o resultado para uma matriz [aq] e M(n x n) na qual 
Qq = 0 quando i + j < n. 

19.10. Se a matriz triangular b resulta de a pelo processo gaussi- 
ano de eliminação, prove que det b = (—1 ) t det a, onde t é o número 
de transposições de linhas feitas durante o escalonamento. (Esca¬ 
lonamento é o modo mais eficaz de calcular o determinante de uma 
matriz n x n quando n > 4.) 

19.11. Escalonando a matriz de Vandermonde 


1 

1 

1 

1 

XI 

X2 

X3 

.. x n 


X 2 

x 2 

X 2 . 

X 2 

x n 

n—1 

. .71— 1 

.,71 —1 

. ,71— 

ú 

X 2 

x 3 

.. x n 


mostre que seu determinante é igual a 

TT (Xi-Xj), 

logo v é invertível se, e somente se, os números xi, X2, ..., x n são dois 
a dois distintos. Como aplicação, mostre que, dados n + 1 pares de 
números (x 0 ,y 0 ),..., (x n ,y n ), onde x 0 <xi< ■ • • <x n , existe um, e so¬ 
mente um, polinómio p de grau <u tal que p(x 0 )=y o ,... ,p(x n )=y n . 
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19.12. Use eliminação gaussiana (escalonamento) para calcular os 
determinantes das seguintes matrizes: 


'1 

-2 

1 

-Y 


2 

1 

3 

2 ' 

1 

5 

-7 

2 


3 

0 

1 

-2 

3 

1 

-5 

3 

e 

1 

-1 

4 

3 

2 

3 

-6 

0 


2 

2 

-1 

1 


19.13. Proponha e resolva um sistema linear com o uso da regra 
de Cramer e calcule pelo menos a inversa de uma matriz usando a 
adjunta clássica. 

19.14. Calcule os determinantes das matrizes 


1 + a 

b 

c 



a 

1 +b 

c 

e 

0 Iin 

a 

b 

1 + c 


In 0 


onde os zeros representam matrizes de dimensões adequadas. 

19.15. Analise o seguinte argumento segundo o qual toda matriz 
anti-simétrica tem determinante igual a zero: “Tem-se a T = —a, 
logo det a = det a T = det(— a) = — det a, logo det a = 0. ” Contraste 
com 


19.16. Defina o produto vetorial de n vetores vi,...,v n € M n+1 
como o vetor v = vi x • • • x v n tal que, para todo w e M n+1 , tem- 
se (w, v) = det[vi,... ,v n , w] = determinante da matriz cujas colunas 
são os vetores vi,..., v n , w nesta ordem. Prove: 

(a) O vetor v = vi x • • • x v n € R n+1 está bem definido e é uma 
função u-linear alternada dos vetores vj,..., v n . 

(b) Seja a = [vi,...,v n ] a matriz (u + 1) x n cujas colunas são 
vi,... ,v n . Para cada i = 1,... ,n+l, seja a t e M(nxn) a matriz 
obtida de a pela omissão da i-ésima linha. Prove que a i-ésima 
coordenada do vetor v = vi x ■ ■ ■ x v n é igual a (—1 ) n+1+1 det a ; . 

(c) O produto vetorial v = vi x ■ ■ ■ x v n é ortogonal a vi,..., v n . 
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(d) Tem-se v = vi x ■ ■ ■ x v n = 0 se, e somente se, vi,..., v n são L.D.. 

(e) Quando v / 0, a norma |v| = |vi x • • • x v n | é igual ao volume do 
paralelepípedo n-dimensional P[vi,..., v n ] C M n+1 . 

[Sugestão: calcule volP[v,vi,... ,v n ], levando em conta (c).) 

(f) Quando os vetores vi,... ,v n são L.I., tem-se det[vi,v n ,vi x 
• ■ ■ x v n ] > 0. 

(g) O produto vetorial v = vi x • • • x v n é o único vetor de M n+1 com 
as propriedades (c), (d), (e), (f) acima. 

19.17. Para cada i = l,...,n + l, seja e M(u x u) a matriz obtida 
omitindo a t-ésima linha de a e M((u + 1) x n). Prove que 

n-t-1 

det(a T a) = ^(det aO 2 . (Identidade de Lagrange.) 

i=1 

[Sugestão: use (e) acima e o Exercício 19.6.] 

19.18. Prove que todo operador ortogonal com determinante positivo 
possui uma raiz quadrada ortogonal. Ela é única? 


20 


O Polinómio Característico 


Boa parte da importância dos determinantes em Álgebra Linear se 
deve ao polinómio característico, o qual já tivemos ocasião de utilizar 
em dimensão 2. Nesta seção, já de posse da noção geral de determi¬ 
nante, vamos considerar esse polinómio em dimensões arbitrárias. 


Seja A: E —> E um operador linear num espaço vetorial E, de 
dimensão finita. A fim de que um número real A seja autovalor de A, 
é necessário e suficiente que exista v / 0 em E tal que (A — ÀI)v = 0, 
ou seja, que o operador A — AI: E —> E tenha núcleo não-trivial e 
portanto não seja invertível. Segundo o Teorema 19.6, isto acontece 
se, e somente se, det(A — AI) = 0. 

Conforme resulta da definição clássica de determinante, 
det( A—AI) é um polinómio de grau u em A, cujo termo líder é (—1 ) n A n . 
Ele é chamado o polinómio característico do operador A e é represen¬ 
tado por pa(A). Assim, 


Pa(A) = det(A — AI). 

As raízes (reais ou complexas) da equação algébrica pa(A) = 0 são 
chamadas as raízes características do operador A. Do que foi dito 
acima, segue-se que os autovalores do operador linear A são suas 
raízes características reais. 
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Se E possui produto interno, o polinómio característico do opera¬ 
dor adjunto A*: E —> E coincide com o do operador A pois 

Pa* (A) = det(A* - AI) = det(A - AI)* = det(A - AI) = p A (A). 

O polinómio característico de uma matriz quadrada ae M(nxn) 
é, por definição, p a (A) = det(a — AI n ), ou seja, é o polinómio carac¬ 
terístico pa(A) do operador A: M n —» M n cuja matriz na base canônica 
é igual a a. Mais geralmente, p a (A) = p A (A) para qualquer operador 
linear A: E —> E cuja matriz, relativamente a uma base arbitrária 
de E, seja a. (Vide Teorema 19.7.) 

Se duas matrizes a e b = p _1 ap são semelhantes então seus 
polinómios característicos são iguais. Com efeito, neste caso, a e 
b são matrizes do mesmo operador A: M n —> R n relativamente a 
bases diferentes, logo p a (A) = p A (A) = Pb(A). Analogamente, se A e 
B = P _1 AP são operadores semelhantes no espaço vetorial E, existem 
duas bases de E relativamente às quais A e B têm a mesma matriz 
a, logo p A (A) = p a (A) = Pb(A). 

Exemplo 20.1. Se um dos operadores A,B: E —> E (digamos, B) 
é invertível então pab(A) = Pba(A). Com efeito, neste caso, BA = 
B(AB)B _1 , logo BA e AB são operadores semelhantes. A igualdade 
entre os polinómios característicos de AB e BA prevalece, mesmo 
quando ambos os operadores, A e B, são não-invertíveis. Isto se 
prova usando um argumento de continuidade, assim: como o opera¬ 
dor B tem no máximo um número finito de autovalores positivos, 
existe um número real c > 0 tal que 0 < e < c =)> B — el in¬ 
vertível. Portanto, para todo e positivo, menor do que c, os opera¬ 
dores (B — eI)A e A(B — el) têm o mesmo polinómio característico. 
Como os coeficientes do polinómio característico do operador B — el 
são evidentemente funções contínuas de e, fazendo e —> 0 concluímos 
que 

PAB = lÍmpA(B-el) = lÍmpíB-eI)A = PBA • 

Exemplo 20.2. Um operador A: E—>E diz-se triangularizável quan¬ 
do existe uma base U de E em relação à qual a matriz de A é trian¬ 
gular. Se a matriz de A na base U ={\i i,..., u n } é triangular inferior 
então, na base W = (u n ,..., ui}, a matriz de A é triangular superior. 
Isto significa que existem subespaços F 0 c E i C C E n = E, in¬ 
variantes por A, tais que dim Et = i. Se A é triangularizável e, na 
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base U, sua matriz a = [ay] é triangular superior então o polinómio 
característico de A é 


n 

Pa(A) = ^Q(aü-A). 
i=1 

Com efeito, a matriz de A — AI na base U também é triangular su¬ 
perior, com os elementos au — À na diagonal, logo seu determinante 
é igual ao produto desses números. (Exemplo 19.5.) Portanto, as 
raízes características de um operador triangularizável são todas re¬ 
ais, logo são autovalores desse operador. Em particular, são reais 
as raízes do polinómio característico de uma matriz simétrica (ou, o 
que é o mesmo, de um operador auto-adjunto num espaço com pro¬ 
duto interno) pois toda matriz simétrica é semelhante a uma matriz 
diagonal, que é certamente triangular. 

A noção de polinómio característico permite concluir que se a 
dimensão de E é um número ímpar então todo operador linear 
A: E —> E possui pelo menos um autovalor. Com efeito, o polinómio 
característico pa(A), sendo um polinómio real de grau ímpar, possui 
pelo menos uma raiz real. 

Quando dim E = 2, sabemos que o polinómio característico do 
operador A: R 2 —> M 2 , cuja matriz na base canônica tem linhas (a, b) 
e (c, d), é igual a 

À 2 — (a + d)A + ad — bc, 

onde o coeficiente de A é menos a soma a + d dos elementos da diago¬ 
nal dessa matriz e o termo constante, ad — bc, é seu determinante. 

Em que pese a importância dos autovalores de A, é uma tarefa 
complicada a determinação dos coeficientes de pa quando seu grau 
é elevado (e muito mais complicado ainda o cálculo de suas raízes). 
Um desses coeficientes é, entretanto, fácil de calcular: o termo inde¬ 
pendente de A é igual a pa( 0), logo é igual a det A. 

Por outro lado, se as raízes de pa são Ai,..., A n , tem-se 

Pa(A) = (—1 ) n (A — At ) ■ ■ ■ (A — A n ). 

Pondo A = 0 vem det A = p A (0)=Ai .A n . Portanto o determi¬ 

nante de A é igual ao produto das suas raízes características, mesmo 
quando algumas delas são números complexos. (Como pa é um po¬ 
linómio real, suas raízes complexas, caso existam, vêm aos pares 
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conjugados, a +1(3 e a — i|3, com produto a 2 + |3 2 , logo o produto das 
raízes de pa é real.) 

Outro termo de fácil determinação no polinómio Pa(A) é o coe¬ 
ficiente de À n_1 . Na expressão clássica de det(A — AI) em termos 
da matriz a = [a t j] de A numa certa base, as parcelas que contém 
a potência A 1 ^ 1 resultam do produto TT(au — À) dos termos da dia¬ 
gonal de a — Àl n , logo são todas da forma (—1 auÀ n-1 . Portanto 
(—1 ) n “ ] Y. q ü é o coeficiente de À n_1 no polinómio pa(A). 

Novamente, a expressão 


n 

PA(A) = (-l) n n(A-A i ) 

i=i 

mostra que o coeficiente de A n_1 é igual a (—l) n_1 vezes a soma das 
raízes do polinómio pa- 

Isto nos leva a concluir que, seja qual for a base escolhida em E, 
a soma lau dos elementos da diagonal da matriz de A nessa base é 
a mesma, igual à soma das raízes características de A, que é sempre 
um número real (mesmo que haja raízes complexas) pois (a + i|3) + 
(a — i|3) = 2a. 

Esta soma lau chama-se o traço do operador A e é designada 
com a notação tr A. 

Segue-se do Exemplo 20.1 que tr AB = tr BA sejam quais forem 
os operadores lineares A, B: E —» E. (Isto também se vê diretamente, 
multiplicando as matrizes de A e B.) 

Com esta notação, quando dim E = 2 o polinómio característico 
de um operador A: E —> E se escreve Pa(A) = A 2 — (tr A)À + det A. 

Vimos no Exemplo 20.2 que as raízes características de um ope¬ 
rador triangularizável são todas números reais. Mostraremos agora 
que vale a recíproca. 

Para isso, faremos uso do seguinte 

Lema. Seja EcE um subespaço invariante pelo operador A: E —> E. 
Se A': F —> F representa a restrição de A ao subespaço F, então o 
polinómio pa' é um divisor de pa- 
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Demonstração: Sejam a' a matriz de A' numa base W c Feaa 
matriz de A numa base U D W. Então 


V 

b 



l-H 

< 

1 

"cí 



e 

a — AI n = 


0 

c 



-1 

t- 

1 

É 

HH 

r< 

1 

V 

O 

_1 


onde r = dim Fen = dim E. Pelo Teorema 19.8, temos 

p A (A) = det(a — Àl n ) 

= det(a' — AI r ) • det(c — AI n _ r ) 

= Pa'(A) • q(A), 


onde 

q(A) = det(c — AI n _ r ). 

Portanto Pa(A) é um múltiplo de Pa'(A). □ 

Teorema 20.1. Se as raízes do polinómio característico pa são todas 
reais então o operador A: E —> E é triangularizável. 

Demonstração: O teorema é óbvio se dim E = 1. Para prová-lo 
por indução, suponhamo-lo válido em dimensão n — 1 e seja dim E = 
n. Introduzamos (caso não exista ainda) um produto interno em 
E. Como A e A* têm o mesmo polinómio característico, o operador 
A*: E —> E tem autovalor logo existe um subespaço E c E, de di¬ 
mensão 1, invariante por A*. O complemento ortogonal E 2 - = E n _i 
é um subespaço vetorial de dimensão n — 1 em E, invariante por A, 
pois A = (A*)*. (Vide Teorema 13.3.) Pelo Lema, se A': E n _i —> E n ^i 
é a restrição de A ao subespaço E n _], as raízes do polinómio carac¬ 
terístico pa' são também raízes de pa, logo são todas reais. Pela 
hipótese de indução, existem subespaços F 0 c Ei c • • • C E n _i, com 
dim E| = i, invariantes por A', logo invariantes por A, o que prova o 
teorema. □ 

Exemplo 20.3. Um operador num espaço vetorial de dimensão 
2 é triangularizável se, e somente se, possui ao menos um auto¬ 
valor real. Por exemplo, uma rotação de ângulo 0, com 0 / 0 e 
0 7 ^ 180°, não é triangularizável pois suas raízes características são 
cos 0±isen 0, ambas complexas. (Vide Exemplo 14.2.) Já o operador 
A: M 2 —> M 2 , A(x,y) = (7x—12p, 3x—5y), tem polinómio característico 
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Pa (A) = A 2 — 2A + 1 com uma raiz real dupla A = 1 , logo A é trian- 
gularizável. Evidentemente, A não é diagonalizável pois se o fosse, 
como seu único autovalor é 1 , seria igual ao operador identidade. Se 
quisermos achar uma base {u,v} c M 2 na qual a matriz de A seja 
triangular superior, basta procurar um autovetor u = (x,y), com 
Au = u, ou seja, basta achar uma solução não-trivial u = (x,y) do 
sistema 7x — 12y = x, 3x — 5y = y. Uma dessas soluções é u = (2,1). 
Tomando, por exemplo, v = (0,1), a matriz de A na base {u,v} é 

q ^ . Com efeito, Au = u e Av = — 6 u + v. 

Exemplo 20.4. Seja A: M 3 —> M 3 a rotação de ângulo 0 em torno do 
eixo z. Temos, para todo (x,y,z) € M 3 : 

A(x,y,z) = (xcos 0 — y sen 0,xsen 0 +y cos 0,z). 

Para evitar casos especiais óbvios, suponhamos 0 < 0 < 180°. Cha¬ 
mando de a a matriz de A na base canônica de M 3 , a matriz de A —AI 
é 


cos 0 — A 

a — AI 3 = sen 0 
0 


— sen 0 0 

cos 0 — A 0 


0 1 -A 


logo det(A — AI) = (1 — A)(A 2 — 2Acos 0 + 1) = pa(A). 

Portanto 0 polinómio característico Pa tem uma raiz real 1 e duas 
raízes complexas cos 0 ± isen 0. Assim, não existe em M 3 uma base 
na qual a matriz de A seja triangular. 

Examinando a demonstração do Teorema 20.1 vemos que, se 0 
espaço E vem provido de um produto interno, ela fornece uma base 
ortonormal em relação à qual a matriz do operador A: E —> E (cujo 
polinómio característico tem apenas raízes reais) é uma matriz tri¬ 
angular. Isto fornece a seguinte interpretação matricial para aquele 
teorema: se 0 polinómio característico da matriz a e Min. x n) é um 
produto de fatores reais do primeiro grau então existe uma matriz 
ortogonal q € M(n x n) tal que t = q T aq (= q ] aq) é uma matriz 
triangular. 

Dados um operador linear A: E —> E e um polinómio 
p(A) = a 0 + aiA + • • • + a m A m , 

0 símbolo p(A) representará 0 operador 

p(A) = a G I + Q] A + • • • + a m A m , 
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obtido de p(A) substituindo-se X 1 por A\ tendo o cuidado de lembrar 
que A° = I, logo A° = 1 deve ser substituído por I. 

Um resultado importante em Álgebra Linear é o Teorema de 
Cayley-Hamilton, segundo o qual, se p = pa é o polinómio carac¬ 
terístico do operador A então p(A) = 0. Verifiquemos a veracidade 
desta afirmação num caso particular. 

Exemplo 20.5. Seja A: R 2 —> M 2 dado por 

A(x,y) = (ax + by,cx + dy). 

O polinómio característico de A é 

Pa(A) = A 2 — (a + d)A + (ad — bc). 

Vamos mostrar que o operador 

B = p A (A) = A 2 - (a + d)A + (ad - bc)I 

é igual a zero. Para isto, basta verificar que Bei = Be 2 = 0. Ora, 
temos Aei = (a, c), A 2 ei = (a 2 + bc, ac + cd), ei =( 1 , 0 ), logo 

Be] = A 2 ei — (a + d)Aei + (ad — bc)ei 

= (a 2 + bc, ac + cd) — (a 2 + ad, ac + cd) -E (ad — bc, 0) 

= ( 0 , 0 ). 

De maneira análoga se vê que Be 2 = 0. Portanto B = 0. Isto mostra 
que o Teorema de Cayley-Hamilton vale em dimensão 2. 

Provaremos, a seguir, o Teorema de Cayley-Hamilton para ope¬ 
radores triangularizáveis. Na próxima seção mostraremos que, num 
espaço vetorial complexo, todo operador é triangularizável. Daí de¬ 
duziremos a validez do teorema para qualquer operador num espaço 
real. 

Teorema 20.2. Se o polinómio característico pa do operador 
A: E—>E é o produto de fatores reais do primeiro grau então pa(A)=0. 

Demonstração: Pelo Teorema 20.1 existe uma base {ui,..., u n } c E 
relativamente à qual a matriz a = [aq] de A é triangular superior. 
Se escrevermos F 0 = {0} e F| = subespaço vetorial de E gerado por 
ui,..., ui, teremos F 0 C h C • • • C E n = E e cada Fi é invariante 
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por A, ou seja, A(F0 C Ft. Por hipótese, temos pa(A) = (—1) n (À — 
Ai)... (A — À n ). Escrevendo B = pa(A), resulta: 

B = (-1 ) n (A - ail I)(A - a 22 I) • • • (A - a nn I) 

pois as raízes características de A são os elementos a ü da diagonal 
da matriz a. Para cada i = 1,... ,u, temos Auí = z + auiM, onde 
z € Ft_i, portanto (A — a ü I)ui = z e F t _i. Isto mostra que, para todo 
i = 1,... ,n, o operador Bt = A — cuJ transforma Ft em Ft_i. Ora, 
temos Pa(A) = B = Bi B 2 ... B n , logo 

F n = E-^) -4 F 2 F, A Fo = {0} 



B = Pa(A) 


Pa (A) transforma F em {0}, isto é, pa(A) =0. □ 

Seja A 0 um autovalor do operador A: F —> E. A multiplicidade 
geométrica de A 0 é a dimensão do subespaço vetorial Fa 0 = {v € 
F; Av = A 0 v}. A multiplicidade algébrica de A 0 é sua multiplicidade 
como raiz do polinómio característico de A, isto é, é o maior inteiro 
m tal que Pa(A) = (A 0 — A) m • q(A), onde q(A) é ainda um polinómio. 

Obviamente, Fa 0 é um subespaço invariante por A. Restrito a 
esse subespaço, A coincide com A 0 I, ou seja, é simplesmente a mul¬ 
tiplicação por A 0 . Portanto, o polinómio característico do operador 
A': Fa q —f Fa oJ restrição de A, é igual a (A 0 — A) T , onde r é a dimensão 
de Fa q , ou seja, a multiplicidade geométrica do autovalor A 0 . Pelo 
Lema que antecede o Teorema 20.1, o polinómio característico de A 
é um múltiplo de (A 0 —A) r , ou seja, Pa(A) = (A 0 —A) r q(A). Isto prova o 

Teorema 20.3. A multiplicidade geométrica de um autovalor é me¬ 
nor do que ou igual à sua multiplicidade algébrica. 

Exemplo 20.6. No operador A do Exemplo 20.3, a multiplicidade 
algébrica do autovalor 1 é igual a 2 mas a sua multiplicidade geomé¬ 
trica é 1 . 

Teorema 20.4. Se o operador A: F —> F é auto-adjunto, ou ortogo¬ 
nal, as multiplicidades geométrica e algébrica de qualquer autovalor 
coincidem. 
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Demonstração: Seja F = Fa d = {v e E; Av = À 0 • v). Então F e F 1 
são ambos subespaços invariantes por A. Como vimos no Lema que 
antecede o Teorema 20.1, se indicarmos respectivamente por A': F —> 
F e A": F 1 -) F^ as restrições de A a esses subespaços invariantes, 
teremos Pa = Pa' ■ Pa»> ou seja, pa(A) = (A 0 — À) r • pa"(A), onde 
r = dim F. Mas, pela definição de F, não pode existir em F x (nem em 
lugar algum fora de F) um autovetor correspondente ao autovalor À 0 . 
Logo A 0 não é raiz de pa«. Assim, r é o maior inteiro tal que (A 0 — A) r 
divide pa, ou seja, é a multiplicidade algébrica de A 0 . □ 


Exercícios 

20.1. Assinale V(erdadeiro) ou F(also): 

( ) Os operadores A e A* têm os mesmos autovetores. 

( ) Sejam a a matriz do operador A: M n —> M n na base canônica e 
p uma matriz cujas colunas são autovetores L.I. de A. Então 
p 1 ap é diagonal. 

( ) Se A é autovalor do operador invertível A então A -1 é autovalor 

de A -1 . 

( ) O polinómio característico do operador A + B é a soma dos po¬ 
linómios característicos de A e B. 

( ) Se v é um autovetor comum aos operadores A e B então v é 

autovetor de A + B e de BA. 

( ) Duas matrizes triangulares semelhantes são iguais. 

20.2. Determine os polinómios característicos dos seguintes opera¬ 
dores: 

(a) Um múltiplo cd da identidade; 

(b) Uma projeção P; 

(c) Uma involução; 

(d) O operador de derivação D: V n —> V n . 
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20.3. No espaço vetorial E, de dimensão finita, com produto interno, 
seja Av = (v, a) b um operador de posto 1. Escreva a matriz de A 
numa base ortonormal que comece com ui = a/|a| e, a partir daí, 
determine o polinómio característico de A, seus autovetores e seus 
autovalores com as respectivas multiplicidades. 

20.4. Qual o coeficiente de A 2 no polinómio característico p a (A) de 
uma matriz a = [aq] eM(3x3)? 

20.5. Seja Ei c E um subespaço invariante pelo operador linear 
A: E —> E. Se E = Ei © E 2 , seja P a projeção sobre E 2 paralelamente a 
Ei. Indique com Ai: Ei —> F] a restrição de A a Ei e com A 2 : F 2 —> E 2 
0 operador dado por A 2 V = PAv, v € E 2 . Prove que Pa(A) = Pa, (A) • 
Pa 2 (A). Seja U uma base de E, formada por uma base de Ei seguida 
por outra de E 2 . Mostre que a matriz de A na base U tem a forma 

ai b 

0 a 2 

onde ai e a 2 são as matrizes de Ai e A 2 respectivamente. Dê um 
enunciado mais simples, em termos de matrizes, para a proposição 
cuja tese é pa(A) = p Al (A) -pa 2 (A). 

20.6. Determine 0 polinómio característico, ache os autovalores e 
exiba uma base de autovetores para a matriz 

4 -3 1 1' 

2-111 

0 0-43 

0 0 2 1 

20.7. Determine 0 polinómio característico e os autovalores da ma¬ 
triz 


'4 

-3 

<13 

a 4 

<15 

ag 

2 

-1 

b3 

b 4 

bs 

bg 

0 

0 

-4 

3 

C 5 

Cg 

0 

0 

2 

1 

d 5 

dg 

0 

0 

0 

0 

1 

3 

0 

0 

0 

0 

3 

-1 


20.8. Quais são os autovetores do operador de derivação D: C°°(M) 
C°°(M) ? 
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20.9. Assinale V(erdadeiro) ou F(also): 

( ) Se um operador é diagonalizável, todas as suas matrizes trian¬ 
gulares são diagonais. 

( ) Seja a uma matriz triangular não-diagonal. Se todos os ele¬ 
mentos da diagonal de a forem iguais, a não é diagonalizável. 

( ) Uma matriz 3x3 que tem dois autovalores distintos é triangu- 
larizável. 


20.10. Sejam A, B: E —> E operadores cujas raízes características 
são todas reais. Se AB = BA, prove que existe uma base na qual as 
matrizes de A e B são ambas triangulares. 

20.11. Ache uma base de M 3 na qual o operador A(x,y, z) = (x + 2y + 
3z,4y + 6z, — y — z) tem uma matriz triangular. Exiba essa matriz. 

20.12. Determine o polinómio caracterítico da matriz 

'0 1 0 ... 0 ' 

0 0 1 ... 0 

0 0 0 ... 1 

_ Ai 1 &n—2 Q-n -3 • • • Q-o_ 

20.13. Obtenha o polinómio característico e os autovalores (com as 
respectivas multiplicidades, algébricas e geométricas) do operador 
A: R n —> M n cuja matriz na base canônica tem todos os elementos 
iguais a 1 . 

[Sugestão: use o Exercício 20.3.] 

20.14. Prove que o módulo do determinante de um operador in- 
vertível é igual ao produto dos seus valores singulares. 

20.15. Sejam A,B: E —> E operadores lineares não-negativos e X a 
raiz quadrada não-negativa de A. Prove: 

(a) AB e XBX têm o mesmo polinómio característico, logo 
det(I +AB) = det(I + XBX). 
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(b) O operador XBX é não-negativo e 

TL 

det(I + XBX) =Hn + A 0, 

i=1 

onde Ài,..., À n são os autovalores de XBX. 

(c) Conclua que det(I+AB) > 1. Em particular, 1 +AB é invertível. 
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Espaços Vetoriais 
Complexos 


Embora a noção de espaço vetorial tenha sentido (e interesse) sobre 
um corpo qualquer, neste livro os vetores (pelo menos até agora) vêm 
sendo multiplicados apenas por números reais. Esta opção foi feita 
por uma série de razões, das quais destacaremos duas. Em primeiro 
lugar, ao nos limitarmos aos números reais, não temos que nos preo¬ 
cupar com as peculiaridades dos vários corpos possíveis o que, num 
livro introdutório, traria o risco de focalizar a atenção no acidental. 
Assim ficou mais fácil nos concentrarmos em questões realmente es¬ 
senciais, sem maior perda de tempo. Em segundo lugar, porque o 
caso real é, sem dúvida, o mais importante. Entretanto, o corpo dos 
números reais não é algebricamente completo: nem todo polinómio 
com coeficientes reais possui raiz real. O corpo dos números comple¬ 
xos não sofre dessa deficiência. Isto torna necessário que alguns teo¬ 
remas referentes a espaços vetoriais reais utilizem números comple¬ 
xos em sua demonstração (como foi feito, um tanto disfarçadamente, 
no Teorema 12.1). Na presente seção, é introduzido o conceito de 
espaço vetorial complexo e é mostrado explicitamente como ele pode 
ser útil para demonstrar teoremas sobre espaços vetoriais reais. 

Nesta seção, os espaços vetoriais que viemos estudando até agora 
serão chamados espaços vetoriais reais e as transformações lineares 
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neles definidas serão chamadas R-lineares. Analogamente, as ma¬ 
trizes até agora consideradas chamar-se-ão matrizes reais. A razão 
para essa qualificação é que introduziremos aqui os espaços vetori¬ 
ais complexos. 

Um espaço vetorial complexo é um conjunto E, cujos elementos 
são chamados vetores, no qual estão definidas duas operações: a 
adição, que faz corresponder a cada par de vetores u,v € E um vetor 
u + v, chamado a soma de u e v, e a multiplicação por um número 
complexo, que a cada número complexo Cea cada vetor v € E faz cor¬ 
responder um vetor C • v = Cv, chamado o produto de C por v. Essas 
operações devem cumprir as mesmas condições impostas na Seção 1 
para os espaços vetoriais reais. Em particular, sev€EeC = a + í|3 
então Cv = ocv + i|3v = av + |3(iv). 

Exemplo 21.1. O conjunto C n de todas as listas u = (£ 1 ,..., £, n ), 
v = (Ci , • • • , Cn) de n números complexos, com as definições u + v = 
(Ei + Ci, • • •, Cn + Cn), C • U = (c • Ci, • • •, C • Cn), é um espaço vetorial 
complexo. Também o conjunto J^XjC) de todas as funções f: X —> C, 
definidas num conjunto arbitrário X, com valores complexos, é um 
espaço vetorial complexo quando munido das definições óbvias para 
f + g e C ■ f. O conjunto M(m x n;C) das matrizes complexas m x n 
também é um espaço vetorial complexo. 

As definições de dependência linear, geradores, subespaço, base, 
dimensão, etc. se fazem para os espaços vetoriais complexos da 
mesma maneira como foram feitas para os reais. Na realidade, tudo 
o que foi dito e demonstrado nas Seções 1 a 9 vale para espaços ve¬ 
toriais complexos e as transformações lineares entre eles, as quais 
chamaremos C -lineares. 

As vezes, uma base do espaço vetorial complexo E será chamada 
uma C -base. 

Um espaço vetorial complexo E pode, de modo natural, ser consi¬ 
derado como um espaço vetorial real: basta que se considere apenas 
a multiplicação dos vetores de E por números reais. Analogamente, 
toda transformação C-bnear A: E —> E entre espaços vetoriais com¬ 
plexos é, a fortiori, M-bnear. Quando for conveniente, usaremos a 
notação A T : E —> E para indicar essa transformação M-bnear, que se 
chama a descomplexificada de A. 

Exemplo 21.2. O conjunto C dos números complexos é um espaço 
vetorial complexo de dimensão 1, logo todo número complexo 
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a+i|3 / 0 fornece uma base para C. Em particular, {1} é uma C-base. 
Considerando C como espaço vetorial real, o conjunto (l,i}cCé L.I. 
pois a • 1 + (3 • i = 0, com a, (3 e R implica a = (3 = 0. Na realidade, 
{1, i) é uma R-base pois todo número complexo a + i(3 = a-1 + |3-ié 
uma combinação linear real de 1 e i. Em virtude da unidimensiona- 
lidade, os operadores C-lineares A: C —> C consistem simplesmente 
na multiplicação por um número complexo fixado a + i(3. Assim, 
para todo v = x + ty eC, tem-se Av = (a + i|3)v = (a + i(3)(x + iy) = 
ax — |3y + i( |3x + ay). 

A correspondência x+iy <-> (x, y) é um isomorfismo natural entre 
os espaços vetoriais reais Cel 2 . Pelo que acabamos de ver, esse 
isomorfismo faz corresponder a cada operador C-linear A: C —> C, 
um operador R-linear A r : R 2 —> R 2 , dado por 

A r O,y) = (ax- |3y, |3x+ ay), 

cuja matriz na base canônica é 

a —(3 
(3 a 

Excetuemos o caso trivial A = 0. Escrevamos 

p = \J o& + |3 2 

e tomemos 0 € R tal que cos 0 = a/p, sen 0 = (3/p. Então a matriz 
de A t tem a forma 

cos 0 — sen 0 
^ sen 0 cos 0 

Isto mostra que o operador A r é uma semelhança, composta da ro¬ 
tação de ângulo 0 com a homotetia de razão p > 0. As semelhanças 
são, portanto, os operadores de R 2 que correspondem aos operadores 
C-lineares não-nulos A: C —> C. 

Guiados pelo Exemplo 21.2, observamos que se U = {ui,..., u n } 
C E for uma base do espaço vetorial complexo E então o conjunto 
W = {ui,..., u n , iui,..., iu n } c E é uma R-base, ou seja, é L.I. sobre 
os reais e, além disso, todo vetor v € E é uma combinação linear dos 
Uj e dos iuj (j = 1,..., n) com coeficientes reais. 

Com efeito, se a n , |3i,..., |3 n E R então 

aiui H-1- a n u n + |3yLui -I-h (3 n iu n = 0 
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implica 

(«•! + iPl )uH-1- (an + ipn)u n = 0, 

logo ai + i)3 1 = • • • = <x n + ip n = 0 pois U é L.I. sobre os complexos. 
Daí resulta que cq = • • ■ = a n = pi = • • • = (3 n = 0, portanto W é L.I. 
sobre os reais. Além disso, dado qualquer v € E, existem números 
complexos cq + i|3i,..., cx n + ipn tais que 

n n n 

v = y (txj+íPj)uj = y_ ajUj + y_ Pj(iuj). 

i=i j=i i=i 

Assim, U' é uma M-base para E. 

Com uma notação de significado evidente, podemos portanto con¬ 
cluir que se dim - E = n então dim^ E = 2n. 

Seja [a k j + ib k j] € M(m x n;C) a matriz da transformação 
C-linear A: E —> E relativamente às bases U = {ui,...,u n } c E e 
V = (vi,..., v m } C F. Considerando E e E como espaços vetoriais 
reais, A pode ser vista como uma transformação R-linear A T : E —> E, 
a descomplexificada de A. Relativamente às bases 

U' = {U!,..., u n , iui,..., iu n } c E 


V = {V!,..., v m , iv,,..., iv m } C E, 
vejamos qual é a matriz de A r . Temos, para j = 1,..., n: 

m mm 

A r Uj = Auj = ^(a kj + ib k j)v k = Y_ a kj v k + y_ b kj (iv k ), 

k=l k=1 k=1 

m m 

Ar(iuj) = A(iitj) = i • Auj = Jj-bkjK + Y_ a k j(iVk), 

k=l k=l 


Portanto a matriz procurada é 


c = 


a 

b 



€ M(2m x 2n), 


onde a = [a k j] € M(m x n) e b = [b k j] € M(m x n). Esta matriz 2m x 
2u chama-se a descomplexificada da matriz [a k j+ib k j] € M(mxn;C). 
Mostraremos logo mais que, quando m = n, tem-se det c > 0, e que 
det c = 0 se, e somente se, det A = 0. 
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Todo espaço vetorial real E de dimensão par 2u pode (de infi¬ 
nitas maneiras) ser considerado como espaço vetorial complexo de 
dimensão n de tal forma que a nova multiplicação de um número 
complexo por um vetor coincida com a multiplicação anterior quando 
esse número complexo é real. Para isso, basta considerar um opera¬ 
dor M-linear J: E —» E tal que J 2 = — I e definir, para cada número 
complexo Ç = a + i(3 e cada vetor v e E, o produto Ç • v como Ç • v = 
av + (3Jv. (A adição de vetores continua a mesma.) 

A verificação de que esta definição atende às exigências sobre as 
regras operacionais é imediata. Resta apenas mostrar como se acha 
um tal operador J. Para isso, fixamos uma base de E, a qual nu¬ 
meramos da forma {ui,..., u n , vi,..., v n }. Existe um único operador 
M-linear J: E —> E tal que Jui = vi,..., Ju n = v n , Jvi = —ui,..., Jv n = 
—u n . Nesta concepção de E como espaço vetorial complexo, o ope¬ 
rador J é simplesmente a multiplicação pelo número i, logo vi = 
iui,..., v n = iu n e (ui,..., u n } c E é uma C-base. 

A noção de espaço vetorial complexo foi introduzida aqui a fim de 
servir como instrumento para obter resultados referentes a espaços 
vetoriais reais. 

A esse propósito, a principal vantagem dos espaços vetoriais com¬ 
plexos sobre os reais é a seguinte: todo operador linear A: E—>E 
num espaço vetorial complexo de dimensão finita possui pelo me¬ 
nos um autovalor (complexo). Antes, porém, de estabelecermos e 
explorarmos este fato, vamos retomar uma afirmação anterior, se¬ 
gundo a qual tudo o que foi feito até a Seção 9 sobre espaços vetori¬ 
ais reais vale igualmente para complexos. Por que não foi incluída a 
Seção 10? 

E que se faz necessário modificar o conceito de produto interno 
quando se trata de um espaço vetorial complexo E. Se o produto 
interno for bilinear então (iv,iv) = i 2 (v,v) = — (v,v), logo não pode 
ser positivo. 

O impasse é resolvido mediante a noção de produto interno her- 
mitiano. Este é, por definição, uma função E x E —> C que associa a 
cada par ordenado de vetores u, v no espaço vetorial complexo E um 
número complexo, representado pela notação (u, v), de tal modo que 
sejam cumpridas as condições seguintes, para quaisquer u,v,u' e E, 
C € C, onde uma barra sobre um número complexo Ç = a + i|3 signi¬ 
fica seu conjugado Ç = a — i|3: 
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1 . (u,v) = (v,u); 

2 . (u + u', v) = (u, v) + (u 7 , v); 

3. (Çu,v) = Ç(u,v); 

4. (u, u) > 0, se u / 0. 

Das propriedades 1. e 2. segue-se que (u,v + v') = (u,v) + (u,v'). 
Com efeito, 

(u, V + v') = (v -I- v', u) = (v, u) + (v\ u) = (v, u) + (v', u) 


(u,v) + (u,v'). 


Analogamente se mostra que 1. e 3. implicam que (u, £v) = 
í (u,v). Assim, o produto interno hermitiano é sesqui-linear, ou seja, 
linear na primeira variável e anti-linear na segunda. Segue-se de 1. 

que (u, v) = (v, u) 44 (u, v) € M. 

Exemplo 21.3. No espaço C n , o produto interno canônico é definido, 
para u = (t 1 ) ...,t n )ev = (Ci,...,C n ), como 


(u, v) — £,1 Cl + ■ ■ ■ + £,nCn 


As 4 propriedades acima são imediatamente verificadas de modo que 
se trata de um produto interno hermitiano. 

Exemplo 21.4. Seja E = C°([a, b];C) o espaço vetorial complexo 
formado pelas funções contínuas f: [a, b] —> C, definidas no intervalo 
[a, b] e tomando valores complexos. Um produto interno hermitiano 
em E pode ser definido pondo 


r b 


( f > 9 > 


fWgW dx, 


a 


para f, g € E quaisquer. 

Exemplo 21.5. Em todo espaço vetorial complexo E, de dimensão 
finita, pode-se introduzir um produto interno hermitiano. (Na reali¬ 
dade, uma infinidade deles.) Basta tomar uma base (ui,..., u n } c E 
e, para dois vetores 
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quaisquer em E, pôr 

(u,v) = Y_ £kCk- 

Isto mostra que, como no caso real, a existência de um produto in¬ 
terno hermitiano num espaço vetorial complexo de dimensão finita 
não é uma propriedade adicional desse espaço mas apenas uma es¬ 
colha que se fez dentre infinitas possibilidades. 

A partir da definição de produto interno hermitiano há poucas 
adaptações a fazer a fim de que as restantes seções, de 10 a 20, 
tenham seus resultados validados (e alguns fortalecidos, como ve¬ 
remos logo mais). 

Uma das modificações a fazer como conseqüência da sesqui-line- 
aridade do produto interno hermitiano diz respeito ao Teorema 11.1, 
que passa a ter o seguinte enunciado: 

Teorema 21.1. Seja E um espaço vetorial complexo de dimensão 
finita, munido de um produto interno hermitiano. A correspondência 
que associa a cada vetor véEo funcional linear <j)(v) = v*: E —> C, 
tal que v*(w) = (w,v) para todo w € E , é uma bijeção <f>: E —> E* tal 
que (u + v)* = u* + v* e (Cv)* = C • v* para quaisquer u,v6Ee(GC, 

Acima, E* é, como antes, o dual de E, ou seja, o espaço vetorial 
complexo cujos elementos são os funcionais C-lineares f: E —> C. 

A diferença entre os Teoremas ll.le21.1é que, neste último, a 
correspondência vnv* não é um isomorfismo entre E e E*, pois falha 
a condição (Cv)* = Cv*, em vez da qual se tem apenas (Cv)* = Cv*. 
Com efeito, para todo w € E, tem-se 

(Cv)*(w) = ( W) Cv) = C (w,v) = Cv*(w), portanto (Cv)* = Cv*. 

Por isso, ela se chama um anti-isomorfsmo. 

O Teorema 21.1 pode então ser refraseado dizendo-se que a bije¬ 
ção 4>: E —> E* nele definida é um anti-isomorfismo. 

Isto não impede de maneira nenhuma que se defina a adjunta 
A*: F —> E de uma transformação C-linear A: E —> F, entre espaços 
vetoriais complexos munidos de produto interno hermitiano, como a 
única transformação C-linear A*: F —> E tal que 

(Av,w) = (v,A*w) 

para v € E, w € F quaisquer. Valem as propriedades (A + B)* = 

A* + B*, (BA)* = A*B*, I* = I, (A*)* = A e (A*) -1 = (A^ 1 )*, nesta 
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última entendendo-se (como antes) que A* é invertível se, e somente 
se, A é. A única diferença diz respeito à adjunta de CA. Tem-se 
(CA)* = CA* quando C é um número complexo. 

Outra mudança ocorre no Teorema 11.2, que passa a ter o enun¬ 
ciado abaixo. E e F são espaços vetoriais complexos, com produto 
interno hermitiano. 

Teorema 21.2. Se a matriz da transformação C-linear A: E—>E 
relativamente a bases ortonormais U = {ui,..., u n } c E e V = 
{vi,...,v m } C E é a = [aicj] € M(m x n) então a matriz da trans¬ 
formação adjunta A*: E —> E relativamente às bases V, U é a matriz 
a* = ã T , transposta da conjugada de a. 

A matriz conjugada de a = [a^] € M(m x n;C) é a matriz ã = 
[ãkj] € M(m x n;C) onde cada elemento ã k j é o número complexo 
conjugado do elemento correspondente a k j da matriz a. 

Um operador C-linear A: E —> E chama-se hermitiano quando 
A = A*, ou seja, quando (Au,v) = (u, Av) para quaisquer u,v e E. 
Em particular, quando u = v, temos (Av,v) = (v, Av). Portanto, 
quando A é hermitiano, a forma quadrática cp(v) = (v, Av) só assume 
valores reais. 

Uma matriz a = [a k j] € M(uxu;C) chama-se hermitiana quando 
a = a*, isto é, quando dj k = ã k j para k,j = 1,... ,n. Em particular, 
Ujj = ãjj para todo j = 1,..., n portanto a diagonal de uma matriz 
hermitiana só possui números reais. Para matrizes reais, hermiti¬ 
ana é o mesmo que simétrica. 

Um operador C-linear A: E —> E é hermitiano se, e somente se, 
sua matriz relativamente a uma (e portanto a qualquer) base orto- 
normal de E é uma matriz hermitiana. 

Um operador C-linear U: E —> E chama-se unitário quando 
U* = EU 1 . Isto equivale a dizer que (Elv, Ebv) = (v,w) para quais¬ 
quer v, w e E. 

Se U: E —> E é um operador unitário então, para todo v e E tem-se 
|liv| = |v|. Vale também a recíproca. Para prová-la, usa-se a identi¬ 
dade de polarização 

(u, v) = ^ [|u + v| 2 — |u — v| 2 + t|u + iv| 2 — i|u — iv| 2 ], 

cuja verificação é imediata. Sua forma é mais complicada do que a 
análoga real, devido ao fato de que o produto interno hermitiano não 
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é simétrico. 

Uma matriz u € M(nxn; C) chama-se unitária quando u* = u 1 . 
Para que isto aconteça basta que u*u = I n , ou que uu* = I n . A pri¬ 
meira destas igualdades significa que as colunas de u formam uma 
base ortonormal de C n (relativamente ao produto interno hermiti- 
ano). A segunda assegura a mesma propriedade para as linhas de 
u. As matrizes unitárias reais são as ortogonais. 

Feitas essas observações de caráter geral, passemos a tirar pro¬ 
veito da estrutura complexa. 

O determinante e o polinómio característico, como não têm nada 
a ver com produto interno, se definem de modo análogo ao caso real. 

Segundo o Teorema Fundamental da Álgebra, todo polinómio 

p(À) = a 0 + aiA H-h a n À n 

com coeficientes complexos a 0 ,..., a n (em particular, com coeficien¬ 
tes reais), com a n = (—l) n , se decompõe como produto 

n 

p(A) = H(A k -A) 

Tc=l 


de fatores do primeiro grau. Os números complexos Ai,..., A n , não 
necessariamente distintos, são as raízes do polinómio p, cada um 
deles comparecendo na lista Ai,..., A n um número de vezes chamado 
sua multiplicidade como raiz do polinómio. A multiplicidade de A k é 
m se, e somente se, m é o maior inteiro tal que p(A) é divisível por 
(A k -A) m . 

Seja pa (A) = det(A — AI) o polinómio característico do operador 
C-bnear A: E —> E. O número complexo A 0 é uma raiz de Pa se, e 
somente se, o operador A — A 0 I é não-invertível, ou seja, existe v / 0 
em E tal que Av = A 0 v. Portanto, para espaços vetoriais complexos, 
as raízes características de um operador A: E —> E coincidem com 
os autovalores desse operador. Como as primeiras sempre existem, 
segue-se que todo operador C-bnear possui autovalores (que podem 
ser reais ou complexos). 

A existência de autovetores nos espaços vetoriais complexos im¬ 
plica a seguinte versão fortalecida do Teorema 20.1, da qual decor¬ 
rerão todas as conclusões a que chegaremos nesta seção. 
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Teorema 21.3. Todo operador C-linear A: E —> E é triangularizável. 

A demonstração é a mesma do Teorema 20.1. Só que agora não 
é necessário fazer hipótese adicional sobre A porque todo operador 
linear complexo tem autovetor. 

Como anteriormente, vale a importante observação de que se E 
possui produto interno hermitiano, o enunciado acima pode ser tor¬ 
nado mais preciso: existe uma base ortonormal U C E na qual a 
matriz de A é triangular superior (ou inferior, se assim o quisermos). 

A versão matricial desse teorema é: para toda matriz complexa 
a existe uma matriz unitária u tal que u*au = u 'au = t é uma 
matriz triangular. 

Vejamos, a seguir, algumas conseqüências do Teorema 21.3. Na 
primeira delas, temos um operador linear A: E —> E num espaço 
vetorial complexo E. 

Teorema de Cayley-Hamilton. Se p 7 \ é o polinómio característico 
do operador C-linear A: E — > E então Pa(A) = 0. 

Demonstração: segue exatamente a linha da demonstração do Te¬ 
orema 20.2 pois, em virtude do Teorema 21.3, todo operador C-linear 
é triangularizável. □ 

Evidentemente, vale uma versão matricial de Cayley-Hamilton. 
Para toda matriz a € M.(u x u;C), o polinómio característico p a (A) 
é exatamente o polinómio pa(A), onde A: C n —> C n é o operador C- 
linear que tem matriz a na base canônica. Tem-se também p a = p A 
para qualquer operador C-linear A: E —> E cuja matriz, relativa¬ 
mente a uma base arbitrária em E, seja igual a a. Qualquer que seja 
o polinómio q(A), vemos que q(a) € M(n x n;C) é a matriz do opera¬ 
dor q (A) na mesma base relativamente à qual a é a matriz de A. Por¬ 
tanto, se p a é o polinómio característico da matriz a e M(u x n;C), 
tem-se p a (a) = 0. 

Se acontecer de a matriz a ser real, seu polinómio característico 
p a é um polinómio real e ainda assim se tem p a (a) = 0, pois todo 
número real é complexo. Segue-se daí o 

Teorema de Cayley-Hamilton para operadores reais. Seja 
A: E —> E um operador linear num espaço vetorial real E. Se pa é 
seu polinómio característico, tem-se pa(A) = 0. 
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Demonstração: Seja a G M(n x n) a matriz de A relativamente a 
uma certa base de E. Então p a (a) = 0. Como p a (a) é a matriz do 
operador p A (A) nessa mesma base, segue-se que p A (A) = 0. □ 

Continuemos apresentando conseqüências do Teorema 21.3. 

Sejam a = [a^], b = [b kj | matrizes n x n triangulares superiores, 
de modo que aiq = W) = 0 se k > j. O j-ésimo elemento da diagonal 
do produto ab é (ab)jj = Y a jrb r j = apbjj pois aj r = 0 se j > r e b r j = 0 

r 

se j < r. Segue-se imediatamente que os elementos da diagonal de 
a m têm a forma aj- 1 . Daí resulta, mais geralmente, se p(A) é qualquer 
polinómio então p (a) é uma matriz triangular superior cuja diagonal 
é formada pelos números p(ajj), onde percorre a diagonal de a. 

Se A: E —> E é um operador C-linear, suas raízes características, 
ou seja, seus autovalores, são (contando multiplicidades) os elemen¬ 
tos da diagonal de uma matriz triangular que representa A rela¬ 
tivamente a uma base conveniente de E. Segue-se do que foi dito 
acima que, se p(À) é qualquer polinómio, os autovalores do opera¬ 
dor p(A), incluindo suas multiplicidades algébricas, são os números 
p(Àj), onde Ài,..., À n são os autovalores de A. 

Um caso particular interessante é o de um operador nilpotente 
A: E —» E. Isto significa, como se sabe, que existe um inteiro m > 0 
tal que A m = 0. Neste caso, se u = dim E afirmamos que o polinómio 
característico de A é p A (A) = (—1 ) n A n . 

Consideremos inicialmente o caso em que A é C-linear. Seja U c 
E uma base relativamente à qual a matriz a = [a k j] do operador 
A é triangular superior. Os elementos Ojj da diagonal de a são os 
autovalores de A, contados com suas multiplicidades. O polinómio 
característico de A é portanto 

p A (A) = n (cijj - A). 

Os elementos da diagonal de a m são cJE, j = 1,..., u. Como a m = 0, 
segue-se que todos os ajj são nulos, logo o polinómio característico de 

A é p A (A) = (—1 ) n A n . 

Do ponto de vista matricial, podemos afirmar que se a é uma 
matriz n x n (real ou complexa, tanto faz) com a m = 0 para algum 
m inteiro > 0 então seu polinómio característico é p a (A) = (—1 ) n A n . 

Daí resulta que, dado o operador M-linear A: E —» E no espaço ve¬ 
torial real E, com dim E = n, se tivermos A m = 0 para algum inteiro 


Seção 21 


Espaços Vetoriais Complexos 291 


m > 0 então o polinómio característico de A é pa(A) = (—1 ) n A n . Com 
efeito, este é o polinómio característico da matriz a do operador A 
numa base qualquer de E, a qual cumpre a m = 0. 

Em seguida, usaremos a forma triangular para provar que o de¬ 
terminante do operador A T : E —> E, descomplexificado de um opera¬ 
dor C-linear A: E —> E, é sempre > 0. 

Com efeito, seja U — {ui,..., u n } c E uma base na qual a matriz 
m = [cikj + ib] C j] de A é triangular superior: a k j = b k j = 0 se k > j. 
Para todo j = 1,..., u, temos 


n 

Auj = 2^(a kj + tb kj )u k . 

k=l 


Consideremos agora a base W = {ui, iui,..., u n , iu n ) do espaço veto¬ 
rial real E. Para obter a matriz c do descomplexificado A r : E —> E na 
base W , observamos que 

A r • Uj = ^(a kj Uj + b k j • úq) e A r • üq = ^(-b kj Uj + a kj ■ kq). 

k k 

Daí resulta que a matriz c tem uma forma “triangular por blocos”. 
Mostramos abaixo esta matriz no caso u = 3: 


"cill 

-bn 

d!2 

—b T 2 

113 

-bi3 

bn 

CM 

bn 

di2 

bi3 

013 

0 

0 

U22 

—022 

<123 

-Ó23 

0 

0 

Ó22 

U22 

Ó23 

023 

0 

0 

0 

0 

0-33 

-Ó33 

0 

0 

0 

0 

Ó33 

033 


Segue-se imediatamente do Teorema 19.8 que o determinante da 
matriz c é dado por: 


n 

det c = ]^[ det 

j=i 


Cl; 



n 


nN +b ?j)- 


(*) 


Sendo a matriz m = [a^ +ib k j] triangular, os números complexos 
Aj = cijj + ibjj são seus autovalores e det m = n Aj. Por outro lado, a 
igualdade (*) mostra que det c = n |Aj| 2 . 
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Vemos então que det A r = det c > 0, valendo det A r = 0 se, 
e somente se, det A = det m = 0. Vemos também que det A r = 
| det A| 2 . 

Noutras palavras, dada a matriz n x n complexa m = [a^ + ibiq], 
formamos as matrizes reais a = [a^], b = [b k j] € M(n x n) e 


c = 


a 

b 



€ M(2n x 2n). 


Vale então det c = | det m| 2 . 

Mais uma exibição de força do Teorema 21.3 é o seu uso para 
demonstrar a versão geral do Teorema Espectral para operadores 
complexos, conforme faremos agora. 

Um operador C-linear A: E —> E num espaço vetorial complexo, 
de dimensão finita, chama-se normal quando comuta com seu ad¬ 
junto, isto é, quando cumpre a condição AA* = A* A. Analogamente, 
uma matriz quadrada a chama-se normal quando aa* = a*a. 

Evidentemente um operador é normal se, e somente se, sua ma¬ 
triz relativamente a uma (e portanto a qualquer) base ortonormal é 
uma matriz normal. 

Teorema Espectral para operadores complexos. Seja E um 
espaço vetorial complexo, munido de um produto interno hermitiano. 
Um operador C-linear A: E —> E é normal se, e somente se, existe em 
E uma base ortonormal formada por autovetores de A. 

Versão matricial do Teorema Espectral. Seja a matriz a € 
M(u x n;C). A fim de que exista uma matriz unitária u tal que 
d = u*au é diagonal é necessário e suficiente que a*a = aa*. 

Demonstração: Continuando com a veia matricial que tem predo¬ 
minado nestas últimas páginas, provaremos a segunda versão, cla¬ 
ramente equivalente à primeira. Seja u uma matriz unitária tal 
que t = u*au seja triangular. Tomando adjuntas, vem t* = u*a*u. 
Multiplicando membro a membro: tt* = u*auu*a*u = u*aa*u. 
Fazendo a mesma multiplicação na ordem inversa: t*t = u*a*au. 
Como aa* = a*a, concluímos que t*t = tt*. Ora, sendo triangu¬ 
lar e normal, t deve ser diagonal, (compare (tt*)ü com (t*t)u para 
i = 1, depois i = 2, etc.) Assim u*au é diagonal. Reciprocamente, se 
d = u*au é diagonal então dd* = d*d, o que nos dá imediatamente 
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u*a*au = u*aa*u. Multiplicando esta igualdade à esquerda por u e 
à direita por u* obtemos a*a = aa* logo a é normal. □ 

Corolário. Se A: E —> E é um operador hermitiano, existe uma base 
ortonormal de E formada por autovetores de A. 

A matriz de A nesta base é diagonal e, sendo hermitiana, os ele¬ 
mentos da diagonal são números reais. Segue-se que os autovalores 
de um operador hermitiano são todos reais. 

Outro caso particular de operador normal é um operador unitário 
o qual também admite uma base ortonormal formada por auto-veto- 
res. Os autovalores de um operador unitário são números complexos 
de módulo 1. 


Exercícios 


21.1. Seja E um espaço vetorial real. O complexificado de E é o 
conjunto E c cujos elementos são as expressões formais u + ív, com 
u,v e E e i = \/—T- Em E c , a igualdade u + iv = u' + iv' significa, 
por definição, que u = u' e v = V. A soma é definida por (u + iv) + 
(u' + iv') = (u + u') + i(v + v') e o produto por um número complexo 
é, ainda por definição, (a + i|3)(u + iv) = (au — |3v) + i(|3u + av). 
Para todo u e E, escreve-se u + iO = u e com isso tem-se E c E c . 
O complexificado de um operador linear A: E —> E é A c : E c —> E c , 
definido por A c (u + iv) = Au + iAv. Prove: 

(a) E c é um espaço vetorial complexo e A c : E c —> E c é um operador 
C-linear. O complexificado de M n é C n . EcE c mas E não é um 
subespaço vetorial (complexo) de E c . 

(b) Toda R-base {ui,... ,u n ) c E é uma C-base de E c . Em particu¬ 
lar, dimc E c = diniR E. A matriz de A c : E c —> E c relativamente 
à base {ui,..., u n } c E coincide com a matriz de A na mesma 
base. Os polinómios característicos de A c e de A são iguais. 

(c) Se À=a+i|3, com (3/0, é autovalor de A c , correspondente ao au- 
tovetor u+iveE c , então {u, v) é a base de um subespaço vetorial 
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FcE, invariante por A, e a matriz da restrição A: F —> F é 

oí |3 
— (3 ot 


21.2. Seja A: E —> E um operador linear, com dim E = n. Considere 
o conjunto M de todos os polinómios p(À) tais que p(A) = 0. Prove: 

(a) Se Pi(à),P2(A) € M e oq, <x 2 são números então cxipi(A) + 
«2P2(A) £ M. 

(b) Se p (A) £ M e q (A) é qualquer polinómio então p(A)q(A) £ M. 

(c) Existe um único polinómio mônico tua(A) £ M tal que todos 
os outros p(A) £ M são múltiplos de ttia(A). [Considere o po¬ 
linómio mônico de menor grau possível em M. Chame-o de 
tua(A). Para todo p(A) £ M tem-se p(A) = q(A) • mA(A) + r(A), 
com gr-r(A) < gr-m-A(A). Segue-se de (a) e (b) que r(A) £ M, 
logo r(A) = 0.] 

(d) O polinómio tha(A) chama-se o polinómio mínimo do operador 
A. Ele é o polinómio mônico de menor grau tal que m.A(A} = 0. 
As conclusões acima valem igualmente para espaços vetoriais 
reais ou complexos. 

(e) Se B: E -4 E é invertível então, para todo polinómio p(A), tem- 
se p(B _1 AB) = B _1 • p(A) • B. Segue-se que os operadores A e 
B _1 AB têm o mesmo polinómio mínimo. 

(f) Para toda matriz a do operador A, tua(A) é o polinómio mônico 
de menor grau tal que mA(a) = 0. 

21.3. Determine o polinómio mínimo dos seguintes operadores: 

(a) O operador zero. 

(b) O operador cd, com a / 0. 

(c) Uma projeção. 

(d) Uma involução. 
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(e) O operador de derivação D: V n —> V n - 

(f) O operador A: R 2 —> M 2 , A(x,y) = (x + 2y,2x + y). 

(g) Qualquer operador A: M 2 —> M 2 . 

Em todos estes casos, compare com o polinómio característico. 


21.4. Prove que um operador é invertível se, e somente se, o termo 
constante do seu polinómio mínimo é / 0. 

21.5. Seja p(A) um polinómio tal que p(A) = 0. Prove que todo 
autovalor Ài do operador A é raiz do polinómio p(A). Conclua daí 
que toda raiz do polinómio característico p A (A) é também raiz do 
polinómio mínimo tua. (A recíproca é evidente porque tua divide pa.) 

21.6. Determine o polinómio mínimo do operador dado por Av = 
(v, a) b. 

21.7. Seja A: E —> E um operador num espaço vetorial de dimensão 
n. Prove: se A k = 0 para algum k > n então A n = 0. 

[Sugestão: Teorema 21.3.] 

21.8. Prove que um operador é nilpotente (isto é A k = 0 para algum 
k e N) se, e somente se, todos os seus autovalores são iguais a zero. 

21.9. Se o operador A é diagonalizável e Ai,..., A k são seus auto¬ 
valores distintos dois a dois, prove que o polinómio mínimo de A é 

m A = (A-A 1 )(A-A 2 )---(A-A k ). 

21.10. Se o operador A: E —> E (num espaço vetorial complexo) é 
diagonalizável, prove que existe um produto interno hermitiano em 
E que torna A normal. 

21.11. Seja E um espaço vetorial (complexo) munido de um produto 
interno hermitiano. Prove que todo operador linear A: E —> E se 
escreve, de modo único, como A = H + iK, onde H,K: E —* E são 
operadores hermitianos e que A é normal se, e somente se, H e K 
comutam. 
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21.12. Sem fazer cálculo algum, conclua que o produto de duas ma¬ 
trizes 2u x 2n do tipo 

a —b 
b a 

é ainda deste mesmo tipo. 

21.13. Assinale V(erdadeiro) ou F(also): 

( ) O determinante de um operador hermitiano é um número real. 

( ) Os autovalores de um operador unitário são iguais a ±1. 

( ) Os autovalores de um operador real anti-simétrico são do tipo 
±i(3, onde (3 é real. 

( ) Se 

cos 0 — sen 0 

Si — 

sen 0 cos 0 J ’ 

existe uma matriz (complexa) 2x2 invertível p tal que p 1 ap = 
d, onde d é diagonal (complexa). 

21.14. Prove que todo operador num espaço vetorial (complexo) de 
dimensão n possui um subespaço invariante de dimensão n — 1. 

21.15. Sejam Ài,...,À n os autovalores do operador A: E —> E 
(repetidos de acordo com suas multiplicidades algébricas). Dado um 
polinómio qualquer p(À), prove que os autovalores do operador p(A) 
são os números p(Ai),... , p(A n ). [Sugestão: Teorema 21.3.] 

21.16. Prove que as seguintes afirmações acerca dos operadores li¬ 
neares A,B: E —> E são equivalentes: 

(a) pa(B) é invertível. (Onde p A é o polinómio característico de A.) 

(b) A e B não têm autovalores em comum. 

(c) Pb (A) é invertível. 

(d) Se rriA e mg são os polinómios mínimos de A e B então m A (B] 
e ttib(A) são invertíveis. [Sugestão: use o exercício anterior.] 
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21.17. Suponha que o polinómio mínimo ttia(A) = (A —Ai) • • • (A —A^) 
do operador linear A: E —* E seja um produto de fatores distintos do 
primeiro grau (At / A, se i / j). Prove: 

(a) Escrevendo ttia(A) = pi(A)(A — At) e Bi = pt(A), tem-se A(Btv) = 
AiBiv (i = 1,..., k) para todo v e E. 

(b) Os polinómios pi (A),... ,pk(A) são primos entre si, logo existem 
qi(A),...,qic(A) tais que 


k 


Y_ qi(A)pi(A) = 1. 


i=1 


(c) Seja Q = qt(A). Para todo veE tem-se v = IBi(Qv), logo os 
autovetores de A geram E. 

(d) O operador A é diagonalizável. 

21.18. Sejam A, B, X operadores lineares no espaço vetorial E. 


Prove: 


(a) Se AX — XB = 0 então A 2 X = XB 2 e, mais geralmente, p(A)X = 
Xp(B) para todo polinómio p. 

(b) Se A e B não têm autovalores em comum então AX = XB se, e 
somente se, X = 0. 

(c) Se A e B não têm autovalores em comum então para todo ope¬ 
rador linear C: E —> E existe um único X € £(E) tal que AX — 


XB = C. 


21.19. Sejam Ai,...,A n os autovalores da matriz a, repetidos de 
acordo com suas multiplicidades algébricas. Prove que 



21.20. Se existir algum k € N tal que A k = I, prove que o operador 
A: E —> E é diagonalizável. [Sugestão: Exercício 21.17.] 
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21.21. Sejam Fi C F 2 subespaços invariantes do operador A: F —> E. 
Se dim F 2 — dim Fi > 2, prove que existe um subespaço F, diferente 
de Fi e F 2 , invariante por A, tal que Fi C F c F 2 . 

21.22. Seja A: E —> E um operador nilpotente no espaço vetorial E 
(real ou complexo) de dimensão n. Tome k, 0 menor número natural 
tal que A k = 0. Prove sucessivamente: 

(a) {0} C Aí[A] C AF(A 2 ) c ... C AÍ{A k ) = E; 

(b) SeJVfA 1 ) =AF(A i+1 ) então Af(A i+1 ) = AF(A i+2 ); 

(c) Nenhuma das inclusões em (a) se reduz a uma igualdade; 

(d) k < n. 


22 


Eq uações a 

Diferenças Finitas 

/ 


Em muitas aplicações da Matemática o tempo é discreto. Isto sig¬ 
nifica que, ao contrário da Cinemática, na qual o tempo flui con¬ 
tinuamente, nestas situações que temos em mente (Economia, por 
exemplo) as grandezas são medidas em instantes isolados, formando 
uma seqüência. Nestes casos, as equações diferenciais não são o ins¬ 
trumento adequado para exprimir a evolução dos fenômenos, sendo 
substituídas pelas equações a diferenças finitas. Nesta seção, estu¬ 
daremos os tipos mais simples dessas equações, como aplicação de 
alguns dos resultados obtidos nas seções anteriores. 

Numa equação a diferenças finitas, a incógnita é uma seqüência 
(xo, xi,..., xic, ...), cujos termos devem satisfazer uma relação dada. 
Se a relação é do tipo Xk+i = f(xk), onde f é uma função determi¬ 
nada, tem-se uma equação de primeira ordem. Se é do tipo x k+ 2 = 
f(xk,Xk+i), tem-se uma equação de segunda ordem, e assim por di¬ 
ante. 

Fixado arbitrariamente um número xo, toda equação de primeira 
ordem Xk+i = f (xk) admite uma única solução (xo, xi,..., Xk,...) 
com valor inicial xo- Basta tomar sucessivamente X] = f(x 0 ), x 2 = 
f(xi), etc. De modo análogo, fixados arbitrariamente xo e xi, toda 
equação de segunda ordem x k+ 2 = fíx k , x k h i) admite uma única 
solução (xo, xi, X 2 ,..., Xk,...) cujos dois valores iniciais são os núme- 
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ros dados. Basta tomar sucessivamente x 2 = f(xo,xi), X 3 = f(xi,x 2 ), 
etc. E assim por diante: toda equação de ordem n possui uma única 
solução cujos u valores iniciais são fixados arbitrariamente. 

Observação. Nesta seção, 0 primeiro termo de toda seqüência tem 
índice 0 , em vez de 1 . 

Exemplo 22.1. A solução da equação de primeira ordem Xk+i = 
Xk + b com valor inicial x Q é a seqüência (x 0 , x 0 + b, x 0 + 2b, ...), de 
termo geral Xk = x 0 + kb ( progressão aritmética de razão b). 

Exemplo 22.2. A equação x k+ i = ax k (linear, homogênea, de pri¬ 
meira ordem, com coeficiente constante) tem para solução, com valor 
inicial x 0 , a seqüência (x 0 , ax 0 , a 2 x 0 ,..., a k x 0 ,...) cujo termo geral é 
Xk = a k .x 0 ( progressão geométrica de razão a). 

Exemplo 22.3. Combinando os exemplos anteriores, seja x k+ i = 
axk+b a equação linear, não-homogênea, de primeira ordem, com co¬ 
eficientes constantes. Se (x 0 , xi,..., Xk...) é a solução desta equação 
com valor inicial x 0 , então temos sucessivamente: 

X] = ax 0 + b, 

x 2 = axi + b = a 2 x 0 + (1 + a)b, 

X3 = 0X2 + b = a J x 0 + (1 + a + a 2 )b, 


Xk = ax^i + b = a k .x 0 + (1 + a-i-h a k 1 )b 

Portanto a solução geral da equação Xk+i = axk + b é 

1 — a k 

Xk = a k .x 0 + --• b, se a / 1 

I — a 

Xk = x 0 + k • b, se a = 1. 

Exemplo 22.4. A equação Xk+i = axk + b pode ser olhada sob 0 
ponto de vista de um operador linear A: M°° —> M°°, no espaço M°°, 
cujos elementos são as seqüências x = (x 0 ,xi,..., Xk,...). O opera¬ 
dor A associa a cada seqüência x a nova seqüência y = Ax, onde 
fjk = Xk| 1 — axk. A equação dada equivale ao problema de achar 
os elementos x € M°° tais que Ax = 6 , onde 6 = (b,b,...) é uma 
seqüência constante de termos todos iguais a b. Como vimos no 
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Teorema 6.4, a solução geral da equação Ax = 6 é a soma de um 
elemento qualquer do núcleo de A (solução geral da equação ho¬ 
mogênea Ax=0) com uma solução particular da equação Ax=6 dada. 
Para obter uma dessas soluções particulares, tentamos a solução 
constante £ = (c, c,...). O número c deve cumprir c = ac + b, isto é, 
(1 — a)c = b. Como no caso a = 1 já foi visto no Exemplo 22.1, supo¬ 
mos aqui a/1 e obtemos c = (1 — a) -1 .b. Por sua vez, a solução ge¬ 
ral de Ax = 0 (equação equivalente a Xk+i = ax| C ) é uma progressão 
geométrica (p, ap, a 2 p,...) cujo primeiro termo p é arbitrário. As¬ 
sim, a solução geral da equação Xk+i = axk + b, para a / 1, é dada 
por Xk = a k .p + (1 — a) _1 .b. Note que x 0 = p + (1 — a) _1 .b, donde 
p = x 0 — (1 -a)' ] .b e, por substituição, vem: 

x k = a k .x 0 — a k (l — a) _1 .b + (1 — a) _1 b = a k x 0 + —— • b, 

I - a 

reobtendo o resultado do Exemplo 22.3. 


22.A. Sistemas Lineares 

Generalizando o Exemplo 22.2, podemos considerar, num espaço ve¬ 
torial E, um operador linear A: E —> E e procurar uma seqüência de 
vetores v k € E tais que 

Vk+i = A.Vk (k = 0,1,2,...). 

Isto se chama um sistema linear homogêneo de primeira ordem, 
de equações a diferenças finitas com coeficientes constantes. 

Evidentemente, dado arbitrariamente um vetor inicial v Q € E, 
existe uma única seqüência (v 0 ,vi,... ,Vk,...) de vetores em E, co¬ 
meçando com v 0 e cumprindo a condição v k+ i = Av k para todo k > 0. 
Basta tomar Vk = A k .v 0 . 

O problema prático de resolver o sistema Vk+i = Avk reduz-se 
portanto ao cálculo das potências sucessivas A k do operador A. Em 
geral, isto não é uma tarefa simples. Há, entretanto, casos par¬ 
ticulares em que ela é factível. Por exemplo, se existir uma base 
U C E formada por autovetores de A (o que se dá quando dim E = n 
e o polinómio característico de A tem n raízes reais distintas, ou 
então quando A é auto-adjunto), o vetor inicial v 0 exprime-se como 
combinação linear 

v 0 = XIU! H-hx n u n 
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de vetores € U, com Au t = AtUi (i = 1,2,..., n). Segue-se que 
A k .v 0 = xiA k ui H-bx n A k u n (k = 0, 

Exemplo 22.5. Seja A: M 2 — > M 2 o operador linear definido por 
A(x,y) = (2x + 2y,2x — y). O sistema de equações a diferenças fi¬ 
nitas v k+ i = Av k , com v k = (x k ,y k ), escreve-se explicitamente como 


x k+ i = 2x k + 2y k 
yk+i = 2x k - y k . 


O polinómio característico do operador Aép(À] = A 2 — A — 6, cujas 
raízes são 3 e —2. Para obter uma base de autovetores {u,v} c M 2 , 
com u = (a, |3) e v = (y, 6), escrevemos as igualdades Au = 3u, 
Av = —2v em termos de coordenadas, obtendo os sistemas 


2a + 2(3 = 3a 
2a — (3 = 3(3 
2y + 26 = —2y 
2y — 5 = -26 


Estes sistemas são indeterminados. Têm que ser indeterminados 
pois os números 3 e —2 foram obtidos de forma que fosse assim. 

Tomemos as soluções a = 2, (3 = 1, logo u = (2,1), e y = 1,6 = —2, 
logo v = (1,-2). Então, para todo k = 0,1,2,3,... temos 


A k .u = 3 k .u = (3 k .2,3 k ) 


e 



Para obter, digamos, a solução do sistema v k+ i = Av k cujo vetor 
inicial é v 0 = (x 0 ,y 0 ), com x 0 = 1, y 0 = 1, exprimimos o vetor 
v 0 = (1,1) como combinação linear dos vetores básicos u = (2,1) 
e v = (1,-2), obtendo 


3 1 

-u — -v 


A solução procurada é, portanto: 



3 k+1 (—2) k 


u — 


5 


5 


v. 
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Em termos das coordenadas Vk = (xk,yk), temos 

x k = ^[3 k+1 + [-2)^] e y k = l[3 k+1 -(-2) k+1 ]. 
o o 

No caso em que dim E = 2, o problema de calcular efetivamente a 
solução do sistema Vk+i = Avk pode ser resolvido em todos os casos, 
como mostraremos agora. 

Tendo visto o caso em que o espaço E possui uma base de autove- 
tores do operador A: E—>E, vamos agora (supondo sempre dim E=2) 
examinar os casos em que tal base não existe. Há duas possibilida¬ 
des, que são as seguintes: 

Primeira. O polinómio característico de A possui uma raiz real 
dupla A, mas A / ÀI. (Evidentemente, quando A = AI todo vetor 
não-nulo em E é autovetor de A, logo este caso já foi visto.) 

Segunda. O polinómio característico de A possui raízes complexas 
A + ip e A — ip (com i = v/—T e p. / 0). 

Consideremos o primeiro destes dois casos. 

Existe um vetor não-nulo u € E tal que Au = Au. Além disso, 
somente os múltiplos de u podem ser autovetores de A. (Com efeito, 
sendo A o único autovalor de A, se existisse um autovetor v não 
múltiplo de u, teríamos uma base {u, v} c E com Au = Au, Av = Av, 
donde A = AI.) 

Tomemos um vetor v tal que {u,vf c E seja uma base. Então 
Av = cxu + |3v com <x / 0 pois v não é autovetor. Se fôr ot ^ 1, 
substituímos v por w = cx _1 v e obtemos uma nova base {u,w} c E 
tal que Au = Au, Aw = u + yw. Na base (u, w), A tem a matriz 
triangular 

A r 

0 n ’ 

cujos autovalores são A, y. Segue-se que y = A. Assim, temos 


Au = Au 
Aw = u + Aw 

A 1' 
0 A 


(*) 


e a matriz de A na base {u, w) é m 
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Das igualdades (*) resulta que para k — 0,1,2,..tem-se 

f A k u = A k u 
1 A k w = kA k_1 u + À k w, 


logo 


m 


A k kA k “ r 
0 A k 


Exemplo 22.6. O operador A: M 2 — > M 2 , dado por A(x,y) = (3x — 
y,x + y), tem o polinómio característico 

p(A) = A 2 -4A + 4, 

o qual admite a raiz dupla A=2, sendo u=(l, 1) um autovetor de A. 
Portanto {u, ez) C M 2 é uma base, com Au = 2u e Ae 2 = (—1,1) = 
— 1 -u+ 2 -e 2 . Tomando w = — e 2 = (0, —1), obtemos a base {u, w} c M 2 , 
com Au = 2u e Aw = u + 2w, logo a matriz de A na base {u, w} é 

'2 T 
m= [o 2 

Pelo que foi dito acima, para obter a solução Vk = (xk,yk) = A k .v 0 do 
sistema 


^k+i = 3xk — yk> 

fjk+1 =x k + y k , 

com vetor inicial v 0 = (3,5), primeiro exprimimos v 0 como combina¬ 
ção linear deuew, obtendo v 0 = 3u—2w. Daí resulta que, para todo 
k = 0 , 1 , 2 ,..., tem-se 


v k = 3.A k u - 2.A k w. 

Como vimos acima, A k u = 2 k u e A k w = k2 k_1 u + 2 k w. Logo 
v k = 2 k [(3-k)u-2w] = 2 k (3 — k, 5 — k). 

Em termos das coordenadas, isto significa que 

x k = 2 k (3 — k) e y k = 2 k (5 — k). 
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Para completar o estudo de sistemas lineares de equações a dife¬ 
renças finitas no caso 2x2, trataremos agora o caso de um operador 
linear A: E —> E, (com dim E = 2) cujas raízes características são 
números complexos À + ip,A — ip, com p / 0. 

Será conveniente considerar o complexificado de E, que é o espaço 
vetorial complexo E c , de dimensão (complexa) 2, cujos elementos têm 
a forma u + iv, onde u, v £ E. As operações em E c são dadas por 

(u + iv) + (u' + iv') = (u + u') + i(v + v') 


e 

(a + i(3)(u + iv) = (au — |3v) + i(av + |3p). 

Tem-se EcE c de modo natural, pois u=u+i.O. O operador A: E—>E 
estende-se a um operador A c : E c —> E c , chamado o complexificado de 
A, pondo-se, por definição, A c (u + iv) = Au + iAv. Toda base de E 
é também uma base de E c , relativamente à qual a matriz de A c é a 
mesma matriz de A. Em particular, os polinómios característicos de 
A e A c coincidem, logo À + ip e À — ip são autovalores distintos do 
operador C-linear A c : E c —> E c . Para nossos efeitos, basta considerar 
o autovalor À + ip. 

Seja u + iv £ E c um autovetor de A c correspondente ao autovalor 
À + ip. Então u, v £ E são vetores não simultaneamente nulos, com 
A c (u + iv) = (À + ip)(u + iv), ou seja: 

Au + iAv = (Au — pv) + i( pu + Àv), 


logo 

Au = Au — pv e Av = pu + Av. (*) 

Afirmamos que os vetores u, v £ E são linearmente independen¬ 
tes. Em primeiro lugar, u e v são ambos / 0 pois se um deles fosse 
nulo o outro seria /0e, pelas equações (*), este seria um autovetor 
do operador A: E —■> E. Em seguida, se u e v fossem L.D. teríamos 
v = au, logo Au = Au — pv = (A — ap)u e u seria um autovetor de A. 

Portanto, {u, v}cEé uma base, relativamente à qual a matriz do 
operador A: E —> E tem a forma 


A p 
-p A 


a = 




306 Equações a Diferenças Finitas 


Seção 22 


O cálculo das potências do operador A ou, equivalentemente, da 
matriz a se baseia na observação de que as matrizes da forma 

’ A p 
-p A 


se comportam, em relação à adição e à multiplicação, do mesmo 
modo que os números complexos À + ip. 

Mais precisamente, se associarmos a cada número complexo 
z = x + iy a matriz 


cp(z) 


x y 
-y * 


teremos uma correspondência injetiva cp tal que cp(z + w) = tp(z) + 
cp(w) e cp(z.w) = cp(z).cp(w), onde z + w e z.w são as operações 
de adição e multiplicação de números complexos e cp(z) + (p(w) e 
cp(z).cp(w) são as operações correspondentes com matrizes. 

Assim, se quisermos calcular a k-ésima potência da matriz 


A p 
-p A 


basta calcular (A + ip) k = x + íy e teremos 


r _ 

k 

r _. 

A p 


x y 

-p A 


-y x 


Ora, as potências de um número complexo se calculam facil¬ 
mente com a fórmula de De Moivre: basta escrevê-lo sob a forma tri¬ 
gonométrica A+ip = p(cos 0+í sen 0) e então (A+ip) k = p k (cos k0 + 
i sen k0). Aí, p = \J A 2 + p 2 , cos 0 = A/p e sen 0 = p/p. Portanto: 

cos k 0 sen k 0 

— senk0 cosk0 

Se temos, por exemplo, um operador A: M 2 —> K 2 , dado por 
A(x,y) = (ax + by,cx + dy), cujas raízes características são os nú¬ 
meros complexos A ± ip, segue-se da discussão acima que existe uma 
base {u, v} c M 2 em relação à qual a matriz de A k tem a forma 



P 


k 


cosk0 
— senk0 


senk0 
cos k 0 ’ 
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onde 

p = v^A 2 + p 2 , cos 0 = A/p, sen 0 = p/p. 

Depois de obtidos A, p, a base {u,v} se determina resolvendo o 
sistema Au = Àu — pv, Av = pu + Àv, de 4 equações com 4 incógnitas 
que são as coordenadas dos vetores u = (x,y) e v = (s,t). Em termos 
dessas coordenadas, o sistema se escreve como 

ax + by = Ax — ps 
cx + dy = Ay — pt 
as + bt = px + Às 
cs + dt = py + At 

ou 


(a —À)x +by 

+ps 


= 0 

o 

X 

+ 

& 

1 


+yt 

= 0 

—px 

+(a — À)s 

+bt 

= 0 

-M-y 

+cs 

+(d — À)t 

= 0. 


Exemplo 22.7. Consideremos o sistema xic+i = 3xk — y^, y^+i = 
2xk + yi<, com vetor inicial v 0 = (1,1). Ele nos fornece o operador 
A: M 2 —> M 2 , A(x,y) = (3x — y,2x + y), cuja matriz na base canônica 
é 

'3 -T 

2 1 J ’ 

logo o polinómio característico é p(A) = À 2 — 4A + 5, cujas raízes são 
2 ± i. Existe uma base {u,v} c M 2 , com u = (x,y), v = (s,t), tal que 
Au = 2u — v, Av = u + 2v. Para obter esta base, devemos achar uma 
solução não-nula do sistema 

3x — y = 2x — s 
2x + y = 2y -1 
3s — t = x + 2s 
2s +1 = y + 2t 


x — y +s = 0 

2x - y +t = 0 

—x +s —t =0 
—y +2s —t = 0. 


ou seja 
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Por escalonamento, encontramos x = s — t, y — 2s — t, onde s, t são 
arbitrários. Tomamos s = 1, t = 0 e obtemos x = 1, y = 2. Logo 
u = (1,2) e v = (1,0) formam uma base de M 2 , relativamente à qual 
o operador A tem a matriz 

' 2 1' 
a “ [-1 2 ' 

O número complexo 2 + i tem módulo p = y/5. Um ângulo 0 tal que 
cos 0 = 2/y/5 é 0 = 26°33 , 54" ou seja, 0 = 0,463 rad. Então, para 
todo k = 0,1,2..temos 

cos k 0 sen k 0 
— senk0 cosk0 

A solução do sistema v k+ i = Av k com vetor inicial v 0 = (1,1) é 
dada por v k = A k .v 0 . Para obtê-la explicitamente, devemos começar 
exprimindo v Q como combinação linear dos vetores básicos u = (1,2) 
e v = (1,0). Temos v 0 = + \v. Portanto 

v k = ^A k u+ ^A k v. 

Ora, a k éa matriz de A k na base {u, v}. Logo 

A k u = 5 k//2 (cosk0 • u — senk0 • v) 


= (x/5) k 


e 

A k v = 5 k/7 (sen k 0 • u + cosk0 • v). 
Noutras palavras: 

A k u = 5 k//2 (cosk0 — sen k 0,2 cos k0) 


A k v = 5 k ^ 2 (senk0 + cosk0,2senk0). 

Portanto 

v k = ^A k u + ^A k v = 5 k/2 (cosk0, cosk0 + senk0). 

Concluímos então que 

x k = 5 k/2 cos k 0; 

y k = 5 k / 2 (cosk0 + senk0), 

com 0 = 26°33'54" = 0,463 rad, é a solução do sistema x k+1 = 3x k —y k , 
y k +i = 2x k + y k que cumpre x 0 = 1, y Q = 1. 
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22.B. Uma Aplicação do Teorema de Cayley-Hamilton 

Uma forma alternativa de calcular as potências sucessivas A k do 
operador linear A: E —> E com dim E = n, consiste em observar 
que, em conseqüência do Teorema de Cayley-Hamilton, basta que se 
considerem os expoentes k < n — 1. Com efeito, se 

Pa (A) = (—1 ) n A n + a n -i A n 1 + ■ ■ ■ + cp A + a 0 

é o polinómio característico do operador linear A, segue-se de 
Pa (A) = 0 que 

A n = ±(a n _i A n ' + • • • + ai A + Q 0 I). 

Usaremos este fato para calcular as potências A k de um operador 
linear A: E —> E, onde dim E = 2. Neste caso, o grau do polinómio ca¬ 
racterístico pa (A) sendo igual a 2, segue-se que o resto da divisão de 
A k por Pa (A), para todo k > 2, tem a forma cxA + |3. (Por simplicidade, 
escrevemos a, |3 em vez de ak, |3k.) Podemos portanto escrever 

A k = P a(A) • q(A) + oíA + (3, 

donde 

A k = pa(A) • q(A) + aA + (31. 

Como Pa (A) = 0, segue-se que A k = aA + (31. 

Para encontrar a e (3, suponhamos inicialmente que as raízes 
características Ai e A 2 sejam distintas. Por definição, temos pa(Ai ) = 
Pa(A 2 ) = 0 logo da identidade A k = p A (A) • q(A) + aA + (3 resultam as 
igualdades: 

aAi + (3 = A k 
aA 2 (3 — A k . 

Como estamos supondo Ai / A 2 , temos acima um sistema determi¬ 
nado, que nos permite obter valores únicos para a e |3. Observe 
que este argumento vale, inclusive, quando as raízes características 
Ai e A 2 são números complexos. Neste caso, usa-se a forma trigo¬ 
nométrica para calcular as potências A k e A k e vê-se que as soluções 
a, |3 do sistema acima são números reais. 

Consideremos agora 0 caso em que 0 polinómio característico 
Pa (A) do operador linear A possui uma raiz (real) dupla Aj. Então 
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sabemos que Ai, além de raiz do polinómio p A (A), é também raiz de 
sua derivada p A (A). Portanto a identidade 

A k = p A (A)-q(A) + aA + |3 

fornece a equação cxAi + (3 = A k enquanto que sua derivada 

kA k ~' =pÁ(A) • q(A) +p A (A) • q'(A) + a 

fornece, em virtude das relações p A (Ai) = 0 e p A (Ai) = 0, a igualdade 
a = k • A k_1 , logo (3 = A k (l — k). 

22.C. Equações Lineares de Segunda Ordem 

Estudaremos apenas as que têm coeficientes constantes. Primeiro 
as homogêneas: 

Xk+2 + ax k+l + bx k = 0. (*) 

Podemos reduzir o estudo da equação acima ao sistema linear de 
primeira ordem: 

x k+l — tJk 

yk +1 = -bx k - ay k , 

onde foi introduzida a incógnita auxiliar y k = x k+ i. (Em particular, 
y 0 = xi.) Usando os métodos do item 22.A, obtemos as seqüências 
(xk) e (y k ), com valores iniciais x 0 , y 0 dados. Isto significa que a 
equação (*), quando são fixados os valores iniciais x 0 , xi, tem por 
solução a seqüência (x k ) que responde ao sistema (**). Com efeito, 
temos: 

Xk+2 = yk+1 = -bx k - ay k = -bx k - ax k+ i. 

Portanto x k+ 2 + ax k+ i + bx k = 0. 

Observe que o polinómio característico do sistema (**) ép(A] = 
A 2 + aA + b. Isto sugere que, a fim de estudar a equação (*), não é 
necessário ter feito anteriormente o estudo dos sistemas lineares. 

A seguir, mostraremos como resolver a equação (*), independen¬ 
temente de sistemas lineares. 

A primeira observação a fazer é que o subconjunto S c M°°, for¬ 
mado pelas seqüências x = (x„,xi,... ,x k ,...) que são soluções da 
equação x k +2 + nx k+ i + bx k = 0, é um subespaço vetorial de dimen¬ 
são 2. 
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O fato de que S é um subespaço vetorial é de verificação imedi¬ 
ata. (S é o núcleo do operador linear A: R°° —> R°°, definido por 
Ax = y, onde y k = x k+ 2 + ax k h i + bx k .) Além disso, o comentário feito 
no início desta seção sobre a existência e unicidade da solução de 
uma equação de segunda ordem x k+ 2 = f (Ak> *k+i )> com valores inici¬ 
ais x 0 , xi pré-fixados, significa precisamente que a correspondência 
S —> R 2 , que associa a cada solução x = (x k ) da equação (*) seus dois 
primeiros termos (x 0 ,xi), nesta ordem, é um isomorfismo entre S e 
R 2 . Portanto o espaço vetorial S tem dimensão 2. 

Este argumento mostra ainda que se x = (x k ) e x' = (x k ) são 
duas soluções da equação x k +2 + ax k+ i + bx k = 0 tais que os vetores 
(x 0 , X]) e (x' 0 , x^) são linearmente independentes então toda solução 
desta equação se exprime, de modo único, como combinação linear 
cxx + |3x'. 

A segunda observação é que se r é uma raiz do polinómio carac¬ 
terístico À 2 + aA + b = 0 então a seqüência r* = (1, r, r 2 ,..., r k ,...) é 
uma solução da equação x k+ 2 + ax k+ i + bx k = 0. 

Com efeito, de r 2 + ar + b = 0 segue-se que 

r k+2 + ar k+1 + br k = r k (r 2 + ar + b) = r k x 0 = 0. 

Resulta dessas duas observações que, para determinar todas as 
soluções da equação x k+ 2 + ax k+ i + bx k = 0, devemos usar as raízes 
do seu polinómio característico a fim de obter duas soluções linear¬ 
mente independentes. Todas as demais soluções serão combinações 
lineares destas. 

Há 3 casos a considerar. 

Primeiro caso. O polinómio característico À 2 -f aÀ + b tem duas 
raízes reais distintas r, s. 

Então as seqüências 

r* = (1 ,r,r 2 ,...,r k ,...) e s* = (1, s, s 2 ,..., s\ ...) 

são soluções e, como r / s, os vetores inicias (l,r) e (1, s) são L.I. em 
R 2 , logo r* e s* são linearmente independentes em R°°. A solução 
geral da equação x k+ 2 + ax k+ i + bx k = 0 é, portanto, 

x k = <xr k + |3s k , 

onde as constantes <x e (3 podem ser determinadas de modo que x 0 e 
xi tenham valores pré-fixados. 
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Exemplo 22.8. A equação Xk +2 — 3xk+i + 2xk = 0 tem o polinómio 
característico A 2 — 3A + 2, cujas raízes são r = 1, s = 2. A solução 
geral desta equação tem a forma Xk = cx + 2 k .|3. Se quisermos, por 
exemplo, a solução com x 0 = 1 e xi =0, temos que achar a, (3 tais 
que cx+|3 = 1 e cx+2|3 = 0, o que nos dá a = 2, (3 = —1, logo a solução 
procurada tem a forma Xk = 2 — 2 k . 

Segundo caso. O polinómio característico A 2 + aA + b tem uma raiz 
real dupla r / 0 . 

Tem-se r = —a/2, logo 2r+a = 0. Já sabemos que uma solução da 
equação Xk +2 + axk+i +bxk = 0 é r* = (1,r,... ,r k ,...). Afirmamos que 
r** = (0, r, 2r 2 ,..., kr k ,...) é outra solução. Com efeito, se x k = kr k 
então 

x k+2 + CDCk +1 + bx k = (k + 2 )r k+2 + a(k + 1 )r k+1 + bkr k 
= r k [k(r 2 + ar + b) + r( 2 r + a)] = 0 . 

Além disso, como os vetores (1, r) e (0, r) são L.I. em M 2 , segue-se que 
r* e r** são soluções linearmente independentes, logo a solução geral 
da equação dada tem a forma 

x k = ctr k + (3kr k = r k (<x + |3k), 

onde as constantes a e (3 podem ser determinadas de maneira a fazer 
com que x 0 e xi assumam os valores iniciais pré-estabelecidos. 

Exemplo 22.9. Seja a equação Xk +2 — 6xk+i + 9xk = 0. Seu polinómio 
característico tem a raiz dupla r = 3. A solução geral desta equação 
é Xk = 3 k (cx + (3k). Se impusermos os valores iniciais x 0 = — 1, xi = 1 
obteremos cx = —1, (3 = 4/3, logo a solução que tem esses valores 
iniciais é Xk = 3 k (—1 + 4k/3). 

Exemplo 22.10. Uma progressão aritmética pode também ser con¬ 
siderada como solução de uma equação a diferenças finitas de se¬ 
gunda ordem, a saber, a equação Xk+ 2 —Xk+i = Xk+i — Xk- Escrevendo-a 
sob a forma Xk +2 — 2 xk+i + Xk = 0 , vemos que seu polinómio carac¬ 
terístico possui a raiz dupla r = 1 , logo sua solução geral é Xk = 
oc + |3k, ou seja, é a progressão aritmética de primeiro termo cx e 
razão (3. 

Terceiro caso. As raízes do polinómio característico A 2 + aA + b são 
os números complexos cx ± i|3 com (3 =A 0, i = y/—\. 
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Escrevemos o número complexo r = a + i|3 sob a forma trigo¬ 
nométrica r = p(cos 0 + isen 0). Exatamente como no caso real, 
verificamos que a seqüência de números complexos r k = p k (cosk 0 + 
isenk0), k = 0,1,2,..é solução da equação dada. Mas é óbvio que 
se a, b são números reais e a seqüência complexa (z 0 , z\ ,.. . , Zk, . . 
com Zk = Xk + üjk, é solução da equação Zk +2 + azk+i + bzk = 0 então 
sua parte real x k e sua parte imaginária ijk cumprem Xk +2 + ax k+ i + 
bxk = 0 e ijk +2 + mjk +1 + bijk = 0 respectivamente. 

Logo as seqüências Xk = p k cosk 0 e yk = p k senk 0 são soluções 
da equação dada. Além disso, como (x 0 ,xi) = (l,pcos 0), (/y 0 ,yi) = 
( 0 , psen 0 ) e sen 0/0 (pois o número r não é real), vemos que 
(x 0 ,X]) e (y 0 )Ui) formam uma base de M 2 , logo as soluções x k = 
p k cos k 0 e y k = P k sen k 0 são linearmente independentes. 

Segue-se que a solução geral da equação x k+ 2 + axk+i + bxk = 0, 
quando a 2 < 4b, é dada por 

Xk = p k [acosk0 + (3 senk0], 

onde as constantes cx, (3 podem ser determinadas de modo que x 0 e 
xi assumam valores arbitrariamente pré-fixados. 

Exemplo 22.11. O polinómio característico da equação Xk+ 2 —2xk+i+ 
4xk = 0 tem as raízes complexas 1 ± iv/3. Escrevendo 1 + i\/3 
sob forma trigonométrica, temos, 1 + iV 3 = 2(cos60° + isen60°) = 
2 (cos f + i sen |). A solução geral da equação dada é 

krt „ kn' 
oí cos — + (3 sen — . 

Se quisermos, por exemplo, obter a solução tal que x 0 = 5, xi = 7, os 
números a, (3 devem satisfazer as condições a = 5, (3 = 2v/3/3. 

Como se vê, a discussão direta das equações de segunda ordem 
(lineares homogêneas, com coeficientes constantes) é bem mais sim¬ 
ples do que o estudo dos sistemas dos quais elas são casos particula¬ 
res. 

22.D. Equações com Segundo Membro Constante 

As equações de que vamos tratar são as do tipo 


x k = 2 k 


x k+ 2 + axk +1 + bx k = c. 
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Como se sabe, a solução geral desta equação é a soma de uma 
solução particular, que obtenhamos por qualquer processo, com a so¬ 
lução geral da equação homogênea x k+ 2 + ax k +i + bx k = 0. Como já 
aprendemos a determinar esta última, basta-nos explicar como se 
pode conseguir uma solução particular. 

Começamos tentando uma solução constante x k = d. Devemos 
ter d + ad + bd = c, ou seja (1 + a+b)d = c. Portanto, se 1 +a + b / 0, 
a única solução constante possível para a equação dada é x k = d = 
(1 + u + b) ' .c. 

Se 1 + a + b = 0, a equação dada (com c / 0) não pode ter solução 
constante. Tentamos uma solução do tipo x k = k.d. Substituindo, na 
equação dada, x k por kd vem 

(k + 2)d + a(k + 1 )d + bkd = c 

ou 

(1 + a + b)kd + (a + 2) d = c. 

Como 1+a+b = 0, obtemos (a+2)d = c. Portanto, quando 1+a+b = 0 
e a / —2, a seqüência x k = kc. (a + 2) -1 é uma solução particular. 

Finalmente, se 1+a+b = 0 e a = —2 então b = 1 e a equação dada 
se torna x k+ 2 — 2x k+ i + x k = c, a qual não possui solução constante 
nem do tipo x k = k.d. Tentemos uma solução da forma x k = k 2 .d. 
Substituindo x k por este valor na equação, obtemos 

(k 2 + 4k + 4)d - 2(k 2 + 2k + 1 )d + k 2 d = c, 

ou seja, 2d = c, donde d = c/2. Uma verificação imediata mostra 
que, realmente, x k = k 2 c/2 é uma solução particular da equação 

Xk +2 - 2x k+1 + x k = c. 

Observação. No início desta seção, vimos que a equação de se¬ 
gunda ordem x k+ 2 + ax k+ i +bx k = 0 pode ser resolvida considerando- 
se o sistema 


x k+1 = úk 

yk +1 = —bx k - ay k . 

Mostraremos agora que, reciprocamente, se quisermos resolver o 
sistema 

x k+ i = ax k + by k 
tJk+i = cx k + dy k 
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com vetor inicial vo = (xo,yo), podemos reduzi-lo a uma equação de 
segunda ordem, resolver essa equação pelo método que acabamos de 
expor e, a partir daí, obter a solução do sistema. 

Evidentemente, um dos números a, b,c, d é diferente de zero. 
Para fixar idéias, suporemos que b / 0. Se (x k ) e (y k ) são as soluções 
do sistema (*) então 


x k+2 = ax k+ i + by k+1 

= ax k+ i + bcx k + bdy k 
= ax k+ i + bcx k + dx k+ i — adx k , 


logo, 

x k +2 - (a + d)x k+ i + (ad- bc)x k = 0. (**) 

Para resolver o sistema (*) com vetor inicial vo = (xo,yo), toma¬ 
mos a solução (x k ) da equação (**) com os valores iniciais xo (dado) 
e X] = axo + byo (com yo também dado). Em seguida, definimos a 
seqüência (y k ) pondo y k = (x k+ i — ax k )/b. Isto dá imediatamente 
x k+ i = ax k + by k . Além disso, o valor yo obtido nesta fórmula coin¬ 
cide com o valor inicial yo anteriormente estipulado. Tem-se ainda 

yk+1 = ^[*k+2 — O-Xk+l] 

= z [(a + d)x k+ i + (bc — ad)x k — ax k+ i ] 
b 

= — [(a + d)(ax k + by k ) + (bc - ad)x k - ax k+1 ]. 

Simplificando, vem y k+ i = cx k + dy k , logo as seqüências (x k ) e (y k ) 
formam a solução procurada do sistema (*). 


Exercícios 

22.1. Para cada uma das equações abaixo, determine a solução que 
tem o valor inicial indicado 

(a) x k+ i = x k - 7, x 0 = 0. 

(b) x k+ i = 6x k , x 0 = 1. 
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(c) x k+1 = 2x k + 5, x 0 = 3. 

(d) x k+1 = x k + k, x 0 = 2. 

(e) x k+ i = ^± 2 -x k , x 0 =x 0 . 

22 . 2 . Prove que o conjunto das soluções de uma equação do tipo 
x k+ i = a k x k + b k (linear, de primeira ordem, homogênea ou não, com 
coeficientes variáveis) é uma variedade afim de dimensão 1 em M°°. 
Em que condições é um subespaço vetorial? 

22 . 3 . Uma solução do sistema 

x k +i = Qk* k + bklJk + Pk 
yk +1 = c k x k + d k y k + q k 

pode ser considerada como um par (s,t) de seqüências 

s = (x 0 ,...,x k ,...), 

t = Cy 0 ,...,y k ,...), 

portanto um elemento de M°° x M°°. Prove que o conjunto S des¬ 
sas soluções é uma variedade afim de dimensão 2 no espaço vetorial 
M°° x M°°. Em que condições S é um subespaço vetorial? 

22 . 4 . Para cada um dos sistemas abaixo, determine a solução 
(v 0 ,...,v k ,...), v k = (x k ,y k ), que tem o valor inicial v 0 = (x 0 ,y 0 ) 

indicado. 


x k+1 = 2x k + 9y k x k+ i = 3x k + 16y k x k+ i = x k + 3y k 

fik+i = x k + 2y k y k+1 = —4x k - 13y k y k+ i = -2x k + y k 

(*o> y 0 ) = (3,-2) (x 0 ,y 0 ) = (3,2) (x 0 ,y 0 ) = (-2,3) 

22.5. Seja v k = (x k ,y k ) uma solução do sistema 

x k+ i = 2x k — y k 
yk+i = 4x k - 2y k . 

Prove que, seja qual for o vetor inicial v 0 = (x 0 ,y 0 ), tem-se x k = 
y k = 0 para todo k > 2. 
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22.6. Sejam À e y. as raízes características (reais ou complexas) do 
operador A: M 2 —> M 2 . Suponha que |À| < 1 e |y| < 1. Seja qual 
for o valor inicial v 0 = (x 0 ,y 0 ), prove que a solução v k = (xk,yk) do 
sistema Vk+i = Av k cumpre lim Xk = 0 , lim yk = 0 . 

22.7. Sejam r = (x 0 ,... ,x k ,...) e s = (y 0 ,... ,yk, • • •) soluções da 
equação Zk +2 + azk+i + bzk = 0. Assinale V(erdadeiro) ou F(also): 

( ) Se r e s são L.I. então, para quaisquer índices k / £, os vetores 

u = (xk,x ( )ev = (y k ,y { ) são L.I. 

( ) Se existirem k / £ tais que os vetores u = (xk,xe) e v = (yk,ye) 
são L.I. então as soluções r e s são L.I. 

( ) Se, para todo k > 0, os vetores u = (xk,Xk+i) e v = (yk,y k +i) 
forem L.D. então r e s são L.D. 

( ) Se r e s são L.D. então u = (xk, Xf) e v = (y k , y?) são L.D., sejam 
quais forem keí. 

22.8. Sejam r=(x 0 ,... ,x k ,...), s=(y Q ,... ,y k ,...), t=(z 0 ,... ,z k ,...) 
soluções da equação Wk +3 + awk +2 + bwk+i + CkWk = 0. Prove: 

(a) Se existirem k < £ < m tais que os vetores v = (xk,x{,x m ), 
v ' = (yioUMhn) e v " = (z k >Z{,z m ) são L.I. então as sequências 
r, s e t são L.I.. 

(b) Se r, s e t são L.I. então existe k > 0 tal que os vetores 

v=(xk,x k+ i,Xk+ 2 ), v'=(y k ,yk+i,yk+ 2 ) e v"=(z k ,z k +i,z k+ 2 ) 

são L.I.. 

22.9. Prove que as seqüências r = (1,2,3,4,0,0,...), s = (1,2,3,1, 
0 , 0 ,...) et = ( 1 , 0 , 0 ,3, 0 , 0 ,...) não podem ser soluções da mesma 
equação Xk+ 3 +ax k + 2 +bxk+i+cxk = 0. [Sugestão: item (b) do exercício 
anterior.] 

22.10. Seja E: R°° —» M°° 0 operador linear definido por 


E(x 0 ,xi,...,x k ,...) = (xi,X 2 ,...,Xk+l,...). 
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Prove que um subespaço vetorial S c M°° é o conjunto das soluções 
de uma equação linear homogênea de ordem n com coeficientes cons¬ 
tantes, 

Xk+n 4" Q-l^k+n—1 + ' ‘ ‘ + U n X k = 0, 

se, e somente se, cumpre as condições seguintes: 

(1) S é invariante por E; 

(2) S tem dimensão finita, igual a n. 

22.11. O método apresentado em 22.B para calcular as potências 
A k mediante o uso do Teorema de Cayley-Hamilton dá fórmulas 
explícitas para essas potências como combinações lineares de 
I, A,..., A n_1 , mas faz uso das raízes características do operador A, 
que são facilmente calculáveis em dimensão 2 porém difíceis de ob¬ 
ter em dimensões superiores. Caso se deseje, não a fórmula geral 
para A k , mas apenas o cálculo explícito de uma dessas potências, 
como A 10 por exemplo, a alternativa seguinte utiliza apenas o cálcu¬ 
lo do polinómio característico pa(A), o que é bem mais factível: Usa- 
se o algoritmo da divisão para escrever À k = pa(A) • q(A) +r(A), onde 
o grau do resto r(A) é menor do que a dimensão do espaço E. Tem-se 
então A k = r(A). Usando este método, mostre que, dado o operador 
A: M 3 —> M 3 , onde A(x,y,z) = (x+2y+3z, 3x+y+2z, x—y+z), tem-se 
A 5 = 40A 2 + 19A — 143 • I e A 10 = 14281 • A 2 + 2246 • A - 49071 -I. 

22 . 12 . Para cada uma das equações abaixo, determine a solução que 
tem os valores iniciais indicados. 

(a) x k+2 = x k+ i + 20x k , x 0 = -3, xi = 2. 

(b) 5 X k+2 = 2x k+1 - 5x k , x 0 = 2, X! = -1. 

(c) x k+2 - 6x k+1 + 25x k = 0, x 0 = 1, x 2 = 3. 


22 . 13 . A seqüência de Fibonacci (x 0 , xi,..., x k ,...) é definida pelas 
condições x 0 = 0, xi = 1 e x k+ 2 = x k+ i + x k . Obtenha a fórmula geral 
para x k em função de k, prove que x k+ 2 = 1 + xi + • • • + x k e que 


lim 

k—>oo 


Xk+1 

Xk 


1 + V5 


2 


(o número de ouro). 
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22 . 14 . Qual a fórmula que exprime x k em função de x 0 , xi e k, 
sabendo-se que 

Xk+2 = ^(Xk+1 +x k ) 


para todo k > 0 ? 

22 . 15 . Resolva a equação x k+ 3 — 6 x k+ 2 + 1 1x k+ i — 6 x k = 0. 

22 . 16 . Ache a solução v k = (x k ,y k ) do sistema 


X k+ 1 = x k - a(x k - y k ) 
y k +i =y k + |3(x k -y k ), 

com vetor inicial v Q = (x 0 ,y Q ), com y G < x 0 , 0<a<1e0<|3<l. 
Mostre que lim x k = lim y k = (|3x 0 + cxy 0 )/(cx + (3), logo este limite 
está mais próximo de x 0 do que de y 0 se, e somente se, <x < (3. Mostre 
que se tem x k < y k para todo k se, e somente se, a + (3 < 1, em cujo 
caso a seqüência (x k ) é decrescente e (y k ) é crescente. 

[Observação: este sistema é um modelo para uma situação sim¬ 
ples de barganha. Cada x k é o preço do vendedor e y k é a proposta 
do comprador. Em cada etapa, o vendedor oferece um desconto pro¬ 
porcional à diferença de preços na etapa anterior e o comprador, por 
sua vez, aumenta sua proposta de modo análogo. Se a soma a + (3, 
da constante do vendedor com a do comprador, for maior do que 1 , 
já na primeira etapa tem-se xi < y i, o que daria o chamado “negócio 
de pai para filho”...] 

22 . 17 . Seja x k+ 2 + ax k+ i + bx k = 0 uma equação cujas raízes carac¬ 
terísticas são os complexos conjugados r e f . Escreva r = p(cos 0 + 
isen 0) como x k = cxp k cos(|3 + k0), onde as constantes a e (3 podem 
ser determinadas de modo a fazer com que x 0 e xi assumam os va¬ 
lores iniciais pré-estabelecidos. [Sugestão: a equação dada admite a 
solução geral complexa x k = £r k + rjf k , onde C, r\ £ C são arbitrários. 
Tomando y = Z, obtém-se a solução real x k = 2 Re (Cr k ). Escreva 
C = f (cos (3 + i sen (3) e use a fórmula cos(x + y) = cos x • cos y — 
sen x • sen y.] 
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22 . 18 . Dada a equação Xk +2 + axk+i + bxk = c k , onde c não é raiz 
característica, prove que existe M € R tal que Xk = M • c k é uma 
solução particular. Se c é uma raiz característica diferente de —a/2, 
prove que existe N tal que Xk = Nkc k é uma solução particular. E se 
c = —a/2 é raiz característica prove que existe P tal que Xk = Pk 2 c k 
é uma solução particular. 

22 . 19 . Se v k+ i = «Vk + Wk, onde |<x| < 1 e lim Wk = 0 , prove que 

k—>oo 

lim Vk = 0 

k—>oo 

22 . 20 . Seja A: E —> E um operador linear cujos autovalores cum¬ 
prem |Ài| < l,...,|À n | < 1. Prove que, para todo v e E, tem-se 
lim A k v = 0. [Sugestão: Tome uma base {ui,..., u n } c E na qual 

k—>oo 

a matriz de A seja diagonal superior. Observe que Atq = w + Atui, 
onde w € S(ui,... ,Ut_i) se i > 1 e Aui = Ajui. Logo A k+1 ut = 
A k w + Ai A k Ui. Ponha Vk = A k Ui, Wk = A k w, <x = Ai e tenha Vk+i = 
avk + Wk- Use indução em i e o exercício anterior para concluir que 
lim A k Ui = 0 (i = 1,..., n), e daí lim A k v = 0 para todo v € E.] 

k—>oo k—>oo 


Apêndice 

A Forma Canônica de Jordan 


O objetivo deste apêndice é provar que, dado um operador linear 
A: E —> E num espaço vetorial complexo de dimensão finita, existe 
uma base de E na qual a matriz a de A é formada por uma série 
de “blocos de Jordan” ao longo da diagonal. Um bloco de Jordan é 
uma matriz triangular inferior cujos elementos diagonais são todos 
iguais a um mesmo auto-valor de A e os elementos imediatamente 
abaixo da diagonal são iguais a 1. Diz-se então que a matriz a está 
na forma canônica de Jordan. Quando E possui uma base formada 
por auto-vetores de A, os blocos de Jordan são todos 1 x 1, e neste caso 
a forma canônica de Jordan para A é uma matriz diagonal. 

A forma canônica de Jordan exibe a matriz mais simples que 
se pode obter para o operador A. Ela se mostra útil no estudo de 
questões que envolvem potências sucessivas do operador A, como as 
equações diferenciais lineares e as equações a diferenças finitas line¬ 
ares. 

Al. Operadores Nilpotentes 

Nesta seção, estudaremos mais um tipo de operadores que podem 
ser representados por matrizes especialmente simples, a saber, os 
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operadores nilpotentes. Os espaços vetoriais aqui considerados po¬ 
dem ser reais ou complexos; não faz diferença. Tampouco se ne¬ 
cessita de um produto interno. Veremos que, mesmo no caso real, 
os operadores nilpotentes possuem matrizes triangulares. O estudo 
aqui feito serve de preparação para a seção seguinte. 

Um operador linear A: E —> E diz-se nilpotente quando se tem 
A k = 0 para algum k e N. O índice de um operador nilpotente é o 
menor número k £ N tal que A k = 0. Isto significa que A k_1 / 0e 
A k = 0. 

Analogamente, uma matriz quadrada a chama-se nilpotente 
quando se tem a k = 0 para algum k € N. Se a k_1 / 0 e a k = 0, 
diz-se que a matriz nilpotente a tem índice k. 

Exemplo Al.l. O operador de derivação D: V n —> V n é nilpotente, 
com índice n + 1 . 

Exemplo A1.2. Um exemplo simples de matriz nilpotente é dado 
pela matriz k x k cuja k-ésima coluna é o vetor nulo e, para 1 < j < 
k — 1, sua j-ésima coluna é ej + i € M k . Para k = 4 essa matriz tem a 
forma abaixo: 

'0 0 0 0 ' 

10 0 0 
a_ 0 1 0 0 • 

0 0 1 0 _ 

A matriz deste exemplo provém do operador A: M k —> M k , definido 
por Aei = e 2 ,..., Aeic-i = c \, Ae^ = 0. Evidentemente, tem-se A k = 
0 e A ^ 1 7 ^ 0. Logo o índice do operador A (e da matriz a) é igual a k. 

Teorema Al.l. Dado o operador A: E —> E, seja u € E um vetor 
tal que A k ~’ u / 0 e A k u = 0. Então os vetores u, Au, ..., A ^ 1 u são 
linearmente independentes. 

Demonstração: Seja 


oqu + «2 Au + • • • + oq c A k 1 u = 0. 

Aplicando o operador A k 1 a ambos os membros desta igualdade, 
obtemos oq A k_1 u = 0. Como A k ^ ] u / 0, concluímos que oq = 0. 
Logo a combinação linear inicial se reduz a 

0 C 2 AU + • • • + ockA 1 ^ 1 u = 0. 
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Aplicando o operador A k 2 , obtemos agora cx 2 A k 1 u = 0, logo a 2 = 0. 
Prosseguindo analogamente, tem-se cxi = otz = ■ ■ ■ = ak = 0. □ 

Corolário 1. Num espaço vetorial de dimensão n, o índice de um 
operador nilpotente é <n. 

Corolário 2. Seja A: E —> E um operador nilpotente de índice n 
num espaço vetorial E, de dimensão n. Existe uma base de E na qual 
a matriz de A tem a forma abaixo: 


'0 

0 

0 ••• 

0 

0' 

1 

0 

0 ••• 

0 

0 

0 

1 

0 ••• 

0 

0 

_0 

0 

0 ••• 

1 

0_ 


Vale, evidentemente, a recíproca do Corolário 2 acima: se alguma 
matriz do operador A: E —> E (onde dim E = n) tem a forma acima 
então A é um operador nilpotente de índice n. 

Se 0 índice do operador nilpotente A: E —» E for menor do que a 
dimensão do espaço E, mostraremos a seguir que existe uma base de 
E na qual a matriz de A é formada por blocos do tipo acima, dispostos 
ao longo da diagonal. 

A idéia da demonstração é extremamente simples, mas a notação 
pode tornar-se longa. A fim de evitar complicações tipográficas, tra¬ 
taremos os casos de índices mais baixos, deixando claro 0 processo 
indutivo que leva ao caso geral. 

O argumento se baseia no seguinte fato, que foi estabelecido na 
demonstração do Teorema do Núcleo e da Imagem, e que destacare¬ 
mos aqui como um lema: 

Lema. Se (Aui,..., Au p } é uma base da imagem do operador 
A: E —> E e (vi,... ,v q ) é uma base do núcleo de A então (ui,... ,u p , 
vi,..., Vq} é uma base de E. 

Seja inicialmente 0 operador nilpotente A: E —> E, de índice 2: 

A / 0 e A 2 = 0. 

Tomemos uma base {Aui,..., Au p } da imagem de A. A condição 
A 2 = 0 significa que Im(A) C N[A), logo existem vetores vi,... ,v q 
tais que 

U ={Au 1 ,...,Au p ,v 1 ,...,v q } 
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é uma base de J\í [A). Pelo Lema, o conjunto 

V = {u 1 ,Au 1 ,...,Up,Aup,v 1 ,...,v q ) 
é uma base de E. 

Em relação a esta base V, a matriz do operador nilpotente 
A: E —> E, de índice 2, é formada por p blocos de matrizes 2x2 
do tipo 

0 0 ' 

1 0 

ao longo da diagonal (onde p é o posto de A), seguidos de q colunas 
nulas, onde 2p + q = dim E. 

Por exemplo, se A: M 5 —» R 5 é nilpotente de índice 2, sua matriz 
na base V tem uma das formas abaixo, conforme seu posto seja 2 
ou 1 : 


'0 

0 

0 

0 

0 ' 


'0 

0 

0 

0 

0 ' 

1 

0 

0 

0 

0 


1 

0 

0 

0 

0 

0 

0 

0 

0 

0 


0 

0 

0 

0 

0 

0 

0 

1 

0 

0 


0 

0 

0 

0 

0 

0 

0 

0 

0 

0 


0 

0 

0 

0 

0 


Em seguida, consideremos um operador nilpotente A: E —> E de 
índice 3. 

A restrição de A ao subespaço invariante Im(A) é um operador 
nilpotente de índice 2. Lembrando que os elementos de Im(A) são 
todos da forma Au, resulta do que vimos acima que existe uma base 
de Im(A) do tipo 

(Au] , A 2 U],..., Aup, A 2 u p , Avi,..., Av q }, 

com A 2 vi = • • • = A 2 v q = 0. Os vetores linearmente independentes 
A 2 ui,..., A 2 Up, Avi,..., Av q pertencem ao núcleo de A, logo podem 
ser incluídos numa base: 

U = {A 2 U!, . . . , A 2 Up, Av!,..., Av q , Wi,..., w r ) C M{A). 

Segue do Lema que o conjunto 

V = {u!, Aui, A 2 U],..., 

Up, Au p , A 2 Up, Vi, AV!, . . . , V q , Av q , Wi, . . . , W T } 
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é uma base de E. 

Em relação a esta base V, a matriz do operador nilpotente 
A: E —> E, de índice 3, é formada por p blocos de matrizes 3x3 
da forma 

'0 0 0 ' 

1 0 0 
0 1 0 _ 

ao longo da diagonal, seguidos por q blocos de matrizes 2 x 2 da forma 

0 0 ' 

1 oj ’ 

ainda ao longo da diagonal, e por r colunas de zeros. (Aqui, p é o 
posto de A 2 , 2p + q é o posto deAep + q+réa dimensão de Aí {A).) 

Eventualmente, pode-se ter q = 0 ou r = 0 (ou ambos). Mas as 
três primeiras colunas do operador nilpotente A, de índice 3, na base 
V, devem ser ez, e 3 e 0 . 

A discussão acima assegura, para um operador nilpotente 
A: M 5 —> M 5 de índice 3, uma base V na qual sua matriz tem uma 
das formas seguintes 


'0 

0 

0 

0 

0' 


0 

0 

0 

0 

0 ' 

1 

0 

0 

0 

0 


1 

0 

0 

0 

0 

0 

1 

0 

0 

0 

ou 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 


0 

0 

0 

0 

0 

0 

0 

0 

1 

0 


0 

0 

0 

0 

0 


conforme 0 posto de A seja 3 ou 2. 

O caso geral se trata da mesma maneira. A fim de dar mais 
precisão e clareza ao seu enunciado, vamos introduzir uma definição. 

Dado um operador nilpotente A: E —> E, dizemos que um su- 
bespaço vetorial E c E é cíclico (em relação a A) quando existe um 
vetor u e E tal que A m u = 0 e {u, Au,..., A™^ 1 u} é uma base de 
E. Isto significa que F c E é um subespaço vetorial de dimensão 
m, invariante por A, e que a restrição de A ao subespaço E é um 
operador nilpotente de índice m. 

Por exemplo, na base V, acima obtida quando analisamos um 
operador nilpotente de índice 3, cada um dos vetores ui,..., u p gera 
um subespaço cíclico de dimensão 3, cada v,(j = 1,..., q) gera um 










326 A Forma Canônica de Jordan 


Apêndice 


subespaço cíclico de dimensão 2 e cada w i[i = 1,...,r) gera um 
subespaço cíclico de dimensão 1 (o que significa Awi = ■ ■ ■ =Awf=0). 

O resultado fundamental sobre operadores nilpotentes é o 

Teorema Al.2. Seja A: E — > E um operador nilpotente de índice k 
num espaço vetorial de dimensão n. Existem inteiros ki = k > k 2 > 
• • • > k r > 0, tais que E = Fi © • • • © F r , onde cada Ft é um subespaço 
cíclico de dimensão k*. 

Evidentemente, ki + • • • + k r = n. 

Tomando em cada Ft (i = 1,..., r) uma base Vt = {iq, Aut,..., 
A kl_1 Ui}, obtemos uma base V = Vi U ... U V r , em relação à qual 
a matriz de A é formada por r blocos at € M(kt x kt), ao longo da 
diagonal. Cada bloco at tem a forma vista no Exemplo 2: para j < kt 
sua j-ésima coluna é ej + i € R ki enquanto sua kfésima coluna é zero. 


A2. Existência da Forma Canônica de Jordan. 

Dado um operador linear A: E —> E num espaço vetorial complexo 
de dimensão finita, provaremos que existe uma base em E na qual a 
matriz de A tem a forma canônica de Jordan: é triangular inferior, 
os auto-valores que formam sua diagonal são repetidos consecutiva¬ 
mente de acordo com suas multiplicidades algébricas e, além disso, 
os elementos imediatamente abaixo da diagonal são iguais a 0 ou 1; 
todos os demais elementos são nulos. 

Teorema A2.1. Seja A: E —> E um operador linear num espaço veto¬ 
rial (real ou complexo) de dimensão finita. Existe uma decomposição 
E = F © G, como soma direta de subespaços invariantes F, G tais que 
A é nilpotente em F e invertível em G. 

Demonstração: Como a dimensão de E é finita, a seqüência de su¬ 
bespaços invariantes 

E D Zm(A) D Im(A 2 ) D ... 

não pode ser estritamente decrescente para sempre. Seja então k o 
menor número natural tal que Im(A k ) = Im(A k+1 ). Afirmamos que 
então Im(A k+1 ) =Im(A k+2 ). Com efeito, 


fm(A k+2 ) = A[Zm(A k+1 )] = A[Im(A k ]] =fm(A k+1 ). 


Apêndice 


A Forma Canônica de Jordan 327 


Segue-se que Im(A k+2 ) = XmíA k|3 ), etc. Note-se que vale 
A7(A) c AF(A 2 ) c • • • C AÍ{A k ) = AF(A k+1 ) = AF(A k + 2 ) 

Com efeito, pelo Teorema do Núcleo e da Imagem, temos 

dim A k+1 ) = dim E — dim Im(A k+1 ) 

= dim E — dim Im(A k ) = dim AÍ{A k ). 

Sejam F = AÍ[A k ) e G = Im(A k ). Evidentemente, E e G são invarian¬ 
tes por A e a restrição A: F —> F é nilpotente. Além disso, a restrição 
A: G —> G é um operador sobrejetivo pois 

A(G) = A[Im(A k )] =Zm(A k+1 ) =Im(A k ) = G. 

Logo A: G —> G é invertível. Mostremos agora que E = F + G. Dado 
v € E, como Zm(A k ) = Im(A 2k ), existe x € E tal que A k v = A 2k x. 
Então, se escrevermos 


v = (v - A k x) + A k x, 

veremos que A k (v — A k x) = A k v — A 2k x = 0, logo v — A k x € F e, 
obviamente, A k x E G. Assim, todo elemento ve Eé soma de um 
vetor de F com um vetor de G, ou seja, E = F + G. Para concluir que 
E = F © G, resta apenas mostrar que F n G = {0}. Ora, sabemos que 

dim F + dim G = dim(F + G) + dim(F n G) 

= dim E + dim(F n G). 

Por outro lado, o Teorema do Núcleo e da Imagem, aplicado ao ope¬ 
rador A k : E —> E, nos dá dim E = dim F + dim G. Segue-se então que 
dim(F n G) = 0, isto é, F n G = {0}. □ 

Teorema A2.2. Seja E = F © G como no Teorema A2.1. Se no é a 
multiplicidade algébrica do autovalor 0 do operador A: E —> E então 
a dimensão do subespaço F é igual a no . Além disso, Fé o núcleo e G é 
a imagem de A n °: E —> E. Segue-se daí que a decomposição E = F© G, 
com as propriedades enunciadas naquele teorema, é única. 

Demonstração: Sejam A': F —» F e A": G —> G as restrições do 
operador A aos subespaços invariantes F e G. Como A' é nilpotente 
e A" é invertível, o polinómio característico de A' é pa'(à) = (—A) n , 
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n = dim F, e o de A" cumpre a condição Pa"( 0) / 0. A prova do lema 
que antecede o Teorema 20.1 nos dá pa = Pa' • Pa" • Por outro lado, 
Pa (A) = A n ° • q(A), com q(0) / 0. Assim, A n • p A «(A) = A n ° • q(A), com 
Pa"( 0) / 0 e q(0) / 0. Segue-se que n = no. Sendo A nilpotente no 
subespaço F de dimensão n 0 , tem-se F c AF(A n °). Reciprocamente, 
se u g Af[A n °), escrevemos u = v + w, com vgF (logo A n °v = 0) e 
wgG. Então 0 = A n °v + A n °w = A n °w. Sendo A invertível em G, de 
A n °w = 0 conclui-se que w = 0, logo u = v € F. Assim, F = AÍ[A n °). 
Para provar que G = Im(A n °), observamos primeiro que, sendo A 
invertível em G, o operador A n °: G —> G também é invertível, logo 
G C Xm(A n °). Por outro lado, para todo ueE, escrevendo u = v + w 
com v € F e w G G, temos A n °u = A n °w € G (pois G é invariante por 
A) logoXm(A n °) c G. Assim, Xm(A n °) = G. □ 

Observação. Para uso na demonstração do próximo teorema, note¬ 
mos aqui que se E = FH-FF r e dim E > dim FH-Fdim F r então 

E = Fi © ■ ■ ■ © F r . Com efeito, tomando em cada subespaço F t uma 
base Vi (i = 1,..., r), o conjunto V = Vi U ... U V T gera E e o número 
de elementos de V é < dim E, logo V é uma base de E. Assim, todo 

vetor v € E se exprime, de modo único, como soma v — vi -I-+ v r , 

com vi G Fi,..., v r G F r . Noutras palavras, E = Fi © ■ ■ ■ © Fi . 

Teorema A2.3. Sejam Ai,..., A r os auto-valores distintos do ope¬ 
rador A: E —> E, num espaço vetorial complexo de dimensão finita. 
Para cada i = 1,..., r, sejam nt a multiplicidade algébrica de \ e 
Ei = AF[(A — Ai I) ni ], Então dim Ei = ni e E = Ei © • • • © E T . 

Demonstração: Mostremos inicialmente que ni é também a multi¬ 
plicidade algébrica do auto-valor 0 do operador At = A — At I. Com 
efeito, pA t (A) = det[(A—Atl)—AI] = det[A —(A+At)I] = Pa(A + Aí). Te¬ 
mos p A (A) = (A —Ai) ni q(A) com q(A t ) / 0. Logop Ai (A) =p A (A + Ai) = 
A n ‘ • r(A), onde r(A) = q(A + Ai), portanto r(0) / 0. Isto posto, 
o Teorema A2.2 nos assegura que dim Ei = ni. Em particular, 
dim Ei + • • • + dim E r = dim E. Pela observação que precede este 
teorema, resta-nos apenas provar que E = Ei + • • • + E r . Ora, o po¬ 
linómio característico do operador A se decompõe na forma 


Pa(A) = (A — Aj) n >. 
1=1 
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Se pusermos 

qi(A) = 

obteremos os polinómios qi (A),..., q r (A), primos entre si. Por um 
conhecido teorema de Álgebra, existem polinómios mi (A),..., m r (A) 
tais que 

mi(A)qi(A) H-hm r (A)q r (A) = 1. 

Segue-se que 


mi (A)qi (A) H-hm T (A)q r (A) = I. 

Assim, para todo v e E, tem-se 


v = vH-h v T , Vt = mt(A)qi(A)v. 


Pelo Teorema de Cayley-Hamilton, temos 

A? 1 • q,(A) = (A - A t I) ni Yl ( A - A i I ) ni 

r 

= ntA-¥)" í =Pa(A) = 0 . 

j=1 

Logo AU Vi = 0, ou seja vt e Et para todo í = 1,..., r. Isto conclui a 
demonstração do teorema. □ 

Teorema A2.4. Os subespaços Et = AA[(A — Ail) ni ] definidos no 
Teorema A2.3 são invariantes por qualquer operador B: E —> E que 
comute com A. 


Demonstração: AB = BA => (A — AJJB = B(A — AJ) => 
=> (A — Ail) ni B = B(A — Ail) ni . Logo v € Ei =^> (A - A t I) nt Bv = 
B (A — A t I) ni v = B • 0 = 0 => Bv € E t . □ 


Corolário. Os subespaços Ei,..., E r são invariantes por A. 

Um bloco de Jordan n x n é uma matriz triangular inferior da 
forma 

Á 

1 A 


B(A;n) = 


1 


A 

1 A 




330 A Forma Canônica de Jordan 


Apêndice 


onde os elementos da diagonal são todos iguais, os elementos ime¬ 
diatamente abaixo da diagonal são todos iguais a 1 e os demais ele¬ 
mentos são zeros. 

Diz-se que uma matriz está na forma canônica de Jordan quando 
ela é triangular inferior, com blocos de Jordan ao longo da diagonal e 
os demais elementos iguais a zero. Os blocos de Jordan devem estar 
agrupados consecutivamente em listas do tipo 

B(À í ;k 1 ),B(Ài;k 2 ),...,B(À i ;k s J, 

onde ki + k 2 -I-1- k Si = rq = multiplicidade algébrica do auto-valor 

Àj da matriz dada. 

Por exemplo, dispondo os blocos B(Ài;3), B(Ài;l) e B(A 2 ;2) ao 
longo da diagonal, obtemos uma matriz 6 x 6 na forma canônica de 
Jordan: 

'À! 0 0 0 0 0' 

1 À! 0 0 0 0 

0 1 À! 0 0 0 

0 0 0 À! 0 0 

0 0 0 0 A 2 0 

_ 0 0 0 0 1 a 2 _ 

Teorema A2.5. Para todo operador A: E —> E num espaço vetorial 
complexo de dimensão finita, existe uma base na qual a matriz de A 
tem a forma canônica de Jordan. 

Demonstração: Seja E = Ei ® • ■ ■ © E r a decomposição assegurada 
pelo Teorema A2.3. O Teorema Al.2 prova a existência da forma 
canônica de Jordan para operadores nilpotentes. Ora, para cada 
i = 1,..., r, a restrição A — At I: Et —> E t é nilpotente. Logo existe 
uma base Vj C Et na qual a matriz de A — At I: Et —> Et tem a 
forma canônica de Jordan (com zeros na diagonal). Logo a matriz 
da restrição A = (A — AJ) + AJ: Et —> Et tem a forma canônica de 
Jordan (com os elementos da diagonal todos iguais a At). Segue-se 
que V = Vi U ... U V T é uma base de E na qual a matriz de A tem a 
forma canônica de Jordan. □ 

Do ponto de vista matricial, o resultado que acabamos de provar 
significa que, para toda matriz quadrada complexa a, existe uma 
matriz (complexa) invertível p tal que p 1 ap está na forma canônica 
de Jordan. 
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Exemplo A2.1. Vamos usar a forma canônica de Jordan para pro¬ 
var que toda matriz invertível possui uma raiz quadrada (complexa). 
Preliminarmente observamos que se x é uma raiz quadrada de 
p 'ap então pxp 1 é uma raiz quadrada de a, pois 

(pxp )= pxp pxp = px"p = p(p ap)p = a. 

Portanto, ao provar a existência da raiz quadrada de uma matriz 
invertível, não há perda de generalidade em supor que essa ma¬ 
triz está na forma canônica de Jordan, que é uma forma triangular 
particular. Em virtude da invertibilidade, os elementos da diagonal 
(auto-valores) são todos diferentes de zero. 

Trataremos explicitamente do caso 4x4, deixando para o leitor 
o caso 3x3 (mais simples) e o caso geral (mais complicado, porém 
suscetível da mesma abordagem). 

Temos então uma matriz da forma 

'a 0 0 0' 

b c 0 0 
a_ 0 d e 0 ’ 

.0 0 f g_ 

com a, c, e, g diferentes de zero, e procuramos uma matriz 

'x 0 0 0' 
y z 0 0 

X = ^ 

m n p 0 
q r s t 

tal que x 2 = a. Ora, um cálculo simples nos dá 

0 0' 

0 0 

p 2 0 • 

s (p +1) t 2 _ 

Portanto as incógnitas x, y, z, m, u, p, q, r, s e t devem satisfazer 
as condições 

(1) x 2 = a, z 2 = c, p 2 = e, t 2 = g, 


y(x + z) z 2 

m(x + p)+ny u(z + 
l(x + t) + ry + ms r(z + t) 


(2) y(x + z)=b, n(z-fp) = d, s(p + t)=f, 
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(3) m(x + p)+uy = 0, r(z + t)+us = 0, 

(4) q(x + t) + ry + ms = 0. 


Como a, c, e, g são diferentes de zero, podemos escolher x, z, p, 
t tais que as igualdades (1) sejam satisfeitas e, além disso, se tenha 
x + z/ 0, z + p/0, p+t/0, x + p/0, z + t/ Oex + t/O. Isto nos 
permite determinar y, n, s de modo a satisfazer as igualdades (2), 
em seguida obter m, r de modo que as igualdades (3) sejam válidas 
e, finalmente, usar (4) para determinar q. 

Observação: Uma matriz não-invertível pode não possuir raiz qua¬ 
drada. Este é o caso, por exemplo, da matriz 

ro oi 


É fácil ver que não existem números complexos x, y, z, t tais que a 


matriz x = 


cumpra x" = a. 


A3. A Decomposição A = N+D 

Nesta seção, mostraremos como visualizar a forma canônica de Jor¬ 
dan de modo intrínseco, exprimindo-a sob o ponto-de-vista de opera¬ 
dores, em vez de matrizes. 

A forma canônica de Jordan, estabelecida na seção anterior, mos¬ 
tra que, dado um operador A: E —> E num espaço vetorial complexo 
de dimensão finita, existe uma base VcEna qual a matriz a de A é 
formada por blocos de Jordan ao longo da diagonal, sendo os blocos 
que correspondem ao mesmo auto-valor de A agrupados consecuti¬ 
vamente. Segue-se que a = n + d, onde d é uma matriz diagonal, 
os elementos dessa diagonal sendo os auto-valores de A repetidos 
de acordo com sua multiplicidade, e n é uma matriz triangular in¬ 
ferior nilpotente (logo os elementos de sua diagonal são todos iguais 
a zero) na qual os elementos imediatamente abaixo da diagonal são 
iguais a 1 ou a 0 e os demais elementos são nulos. 

Resulta imediatamente daí a decomposição A = N + D, onde 
D: E -) E é o operador cuja matriz na base VédeN:E—>Eéo 
operador nilpotente do qual n é a matriz na mesma base V. 






Apêndice 


A Forma Canônica de Jordan 333 


Um operador D: E —> E chama-se diagonalizável quando existe 
alguma base de E na qual a matriz de D é diagonal. Isto equi¬ 
vale a dizer que a referida base de E é formada por auto-vetores do 
operador D. 

Assim, acabamos de mostrar que, num espaço vetorial complexo 
de dimensão finita, todo operador A: E —> E pode escrever-se como 
soma A = N + D de um operador nilpotente com um diagonalizável. 

Na notação do Teorema A2.3, N é o operador cuja restrição a cada 
subespaço Et coincide com A—AJ, enquanto D restrito a cada um dos 
Ei’s é igual a Atl. Como A — A t I e ÀJ comutam para todo i = 1, ..., r, 
segue-se que ND = DN. 

Provaremos a seguir que esta é a única maneira de se escrever 
A = N + D com N nilpotente, D diagonalizável e ND = DN. 

Para maior clareza, destacaremos sob a forma de lemas dois fatos 
elementares que usaremos na demonstração dessa unicidade. 

Lema 1. A restrição de um operador diagonalizável D: E —> E a 
um subespaço invariante F c E é ainda um operador diagonalizável 


D: F -> E. 


Demonstração: Seja V C E uma base formada por auto-vetores de 
D. Introduzimos em E um produto interno hermitiano, impondo que 
a base V seja ortonormal. Relativamente a esse produto interno, D 
é normal. Portanto a restrição D: F —» E é um operador hermitiano, 


logo diagonalizável. (V. Exercício 15.19). 


□ 


Lema 2. A soma de dois operadores nilpotentes que comutam é 
ainda um operador nilpotente. 

Demonstração: Sejam M, N: E —» E com M p = 0, N q = 0 e MN = 
NM. Esta comutatividade assegura que vale o binômio de Newton: 



No somatório acima, as parcelas com i > p são nulas porque, neste 
caso, M 1 = 0. Se, entretanto, tem-se i < p então p + q — í > q, 
logo N p+q_l = 0. Assim as parcelas com i < p também são nulas e 


concluímos que (M + N) p+q = 0. 


□ 
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Teorema A3.1. Seja E um espaço vetorial complexo de dimensão 
finita. Para todo operador linear A: E —> E, existe uma única decom¬ 
posição A = N+D com N : E —> E nilpotente, D: E —» E diagonalizável 
e ND = DN. 

Demonstração: Evidentemente, N e D comutam com A. Pelo 
Teorema A2.4, cada subespaço Ei = — AJ) 111 ] é invariante por N 

e por D. Para i = 1,..., r, sejam Ai, Ni, D t : Ei —> Ei as restrições de 
A, N e D ao subespaço E t . A igualdade Ai = Ni + pode ser escrita 
como (Ai — Ail) + Àil = Ni + Di ou, ainda, como 

(Ai-AiI)-Ni = Di —Ail. (*) 

Pelo Lema 2, o operador (Ai—Ail) —Ni é nilpotente e pelo Lema 1, Di 
é diagonalizável, logo Di — Ail é diagonalizável (pois qualquer vetor 
não-nulo é auto-vetor de Ail). Pela igualdade (*), esses operadores 
são, ao mesmo tempo, nilpotentes e diagonalizáveis, logo iguais a 
zero. Portanto vale Ni = Ai — Ail e Di = Ail para i = 1,..., r. Segue- 
se que N e D são os operadores anteriormente obtidos a partir do 
Teorema A2.3. □ 


Indicações Bibliográficas 


Na seqüência usual das disciplinas matemáticas que se estudam na 
universidade, a Álgebra Linear é pré-requisito para a Análise das 
funções de várias variáveis e para as Equações Diferenciais Ordiná¬ 
rias. Seguem-se duas referências: 

“É de se esperar que vetores, matrizes, transformações lineares, etc constituam 
a linguagem natural para tratar o Cálculo Diferencial pois, afinal de contas, este 
se baseia na idéia de aproximar, na vizinhança de cada ponto do seu domínio, uma 
função “arbitrária” por uma função linear (chamada sua derivada) e, a partir das 
propriedades desta (presumivelmente mais fáceis de constatar) obter informações 
sobre aquela”. 

E. L. Lima 

[1] E. L. Lima, Curso de Análise, uol. 2 (3-edição.) Coleção Projeto 
Euclides, IMPA, 1989. 

A Álgebra Linear está presente em toda parte do estudo das 
funções reais de várias variáveis: na teoria das funções implícitas, 
nas integrais curvilíneas, na discussão dos pontos críticos (na qual 
as formas quadráticas desempenham o papel principal) e nas inte¬ 
grais de superfície, onde é reforçada por seu prolongamento natural, 
a Álgebra Multilinear. 

[2] M. Hirsch e S. Smale, Differential Equations, Dynamical Systems 
and Linear Álgebra. Academic Press, 1974. 

Nestes últimos 20 anos, o texto de Hirsch/Smale firmou-se como 
uma das principais referências para uma introdução moderna ao es¬ 
tudo das equações diferenciais ordinárias e uma preparação para 
a importante área dos sistemas dinâmicos. Ele pressupõe conheci¬ 
mento de Análise a nível dos capítulos iniciais da referência 1 acima 
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e de Álgebra Linear a nível do presente livro. Mais de um terço 
do texto é dedicado às equações diferenciais lineares, o que leva 
os autores a desenvolver, de forma convincente, todo material de 
Álgebra Linear não tratado neste nosso livro. Na realidade, os au¬ 
tores afirmam que o estudo dos sistemas de equações diferenciais 
lineares com coeficientes constantes praticamente se identifica com 
um capítulo da Álgebra Linear. 

Vejamos agora algumas referências de livros sobre Álgebra Li¬ 
near. 

Há poucas décadas eram raros, muito raros mesmo, os livros de 
Álgebra Linear destinados a estudantes de graduação. Hoje em dia 
há centenas deles, refletindo a enorme expansão do ensino desta 
disciplina aos mais variados cursos universitários. (Ver, a respeito, 
a citação de I. Kaplansky abaixo.) 

Aqueles que mencionarei representam uma amostra, extrema¬ 
mente restrita, de três tipos: os livros onde aprendi a matéria, os 
que podem servir de leitura colateral e os que oferecem alternativas 
para estudos posteriores. A priori, aceito a acusação de parcialidade 
nas escolhas. Afinal, de gustibus et coloribus... 


“It is desirable to have at hand not merely the formal operations with matrices, 
but also the (often neglected) interpretation of the matrices by linear transforma- 
tions”. 

G. Birkhoff e S. MacLane 

[3] Garrett Birkhoff e Saunders MacLane, A Survey of Modem Álge¬ 
bra. (Macmillan, 1941. Revised edition 1953.) 


Birkhoff/MacLane é uma das mais bem sucedidas introduções à 
Álgebra Moderna já escritas. Trinta e oito por cento do livro é de¬ 
dicado à Álgebra Linear. Embora a exposição seja feita a partir dos 
conceitos de espaço vetorial e transformação linear, a ênfase domi¬ 
nante é posta nas matrizes e suas “formas canônicas”, especialmente 
matrizes de formas quadráticas. O estilo é ameno e ligeiro, bastante 
agradável. O leitor logo se acostumará com a notação vA, em vez de 
Av, usada pelos autores. 
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“That Hilbert space theory and elementary matrix theory are intimately asso- 
ciated came as a surprise to me and to many colleagues of my generation only after 
studying the two subjects separately. This is deplorable... I present this little book 
in an attempt to remedy the situation.” 

Paul R. Halmos 

[4] Paul R. Halmos, Finite Dimensional Vector Spaces. (Princeton 
Univ. Press 1942. Revised edition: Van Nostrand, 1958. Tradução 
brasileira: Editora Campus, 1978.) 


O livro de Halmos é outro best-seller. Nele, o autor conversa 
com o leitor e procura motivar, com analogias, os conceitos e as 
proposições, tudo isso feito com clareza e coerência lógica. Há uma 
grande preocupação em dar definições e demonstrações sem utilizar 
coordenadas. Isto é feito com o propósito admitido de preparar a ca¬ 
minho para os espaços de dimensão infinita, estudados em Análise 
Funcional. Só que muitas vezes esse purismo se torna artificial. 
Além disso, com vistas a diversas aplicações, a familiaridade do es¬ 
tudante com bases e coordenadas seria de grande utilidade. 

Os livros acima, na ordem citada, me serviram de cartilhas de 
Álgebra Linear, como a tantos estudantes de várias gerações por 
todo o mundo. Eles contêm visões complementares sobre o assunto 
e sobre a maneira de ensiná-lo. 

“Dealing with vector spaces in the abstract also saves effort. The general the¬ 
ory of vector spaces includes not only the vectors and matrices discussed in Chap- 
ters 1 and 2 but also sets of real- and complex-valued functions of a real variable 
and other more exotic mathematical objects. A fact which has been proved once 
and for all in the general theory applies to a wide range of particular cases. That is 
why it is worth investing some intellectual effort in understanding abstract linear 
algebra”. 

D. H. Griffel 

[5] D. H. Griffel, Linear Algebra: A First Course and Applications (2 
vols). (Ellis Horwood Limited, 1989.) 

O livro de Griffel é escrito para estudantes não-matemáticos que 
deverão usar Álgebra Linear em suas carreiras. Ele emprega predo- 
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minantemente matrizes e 1Z n em vez de transformações lineares e 
espaços vetoriais porém, conforme a advertência acima citada, oca¬ 
sionalmente se rende à conveniência de adotar uma atitude mais 
adequada. Trata-se de um livro de grande simplicidade, muito claro 
e bem organizado, com um sabor nitidamente “aplicado”. Contém 
alguns erros matemáticos engraçados (como, por exemplo, “provar” 
que toda matriz anti-simétrica tem determinante zero ou afirmar 
que, pelo Teorema de Cayley-Hamilton, a exponencial de qualquer 
matriz reduz-se a um polinómio nessa matriz). Tais erros são pou¬ 
cos, não interferem no mérito geral e deverão ser corrigidos em pró¬ 
ximas edições. São até instrutivos, inclusive para mostrar ao leitor o 
que pode esperar no futuro ao ler alguns livros de Matemática Apli¬ 
cada. 

“The solution to each problem immediately follows the statement of the pro- 
blem. However, you may wish to try to solve the problem yourself before reading 
the given solution. In fact, even after reading the solution, you should try to re¬ 
solve the problem without Consulting the text. Used thus, ‘3000 Solved Problems 
in Linear Álgebra’ can serve as a supplement to any course in linear algebra, or 
even as an independent refresher course”. 

S. Lipschutz 

[6] Seymour Lipschutz, Schaum’s solved problems series: 3000 sol¬ 
ved problems in Linear Algebra. McGraw-Hill Book Company, 1989. 

A bem-sucedida série Schaum de livros de problemas se baseia 
numa idéia tipo ovo-de-Colombo: em vez de disputar sua adoção con¬ 
tra tantos e tão fortes competidores, esses livros-texto se disfarçam 
em coleções de problemas e assim convivem pacificamente com seus 
rivais, sendo adquiridos pelos estudantes, mesmo quando não reco¬ 
mendados pelos professores, como fontes suplementares de exercí¬ 
cios. De um modo geral (e isto se aplica ao livro de Lipschutz) eles 
contêm uma boa lista de problemas rotineiros, que não exigem gran¬ 
des rasgos de imaginação. Mas, principalmente porque são acompa¬ 
nhados de solução, esses exercícios são uma ajuda valiosa para os 
alunos que necessitam um esforço adicional a fim de acompanhar o 
curso. Existe um livro análogo, também de Lipschutz, chamado “Li¬ 
near Algebra”, que foi traduzido para o português e publicado pela 
McGraw-Hill do Brasil, em 1972. 
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Os livros [5], e [6]. acima se enquadram na categoria de leitura 
colateral. Seguem-se três referências a livros que constituem opções 
para a continuação deste texto. 

“Matrix theory can be studied with no mention of linear spaces and most of the 
results in this book are of such a nature. However, the introduction of linear spaces 
and the role of matrices in defining or representing linear transformations on such 
spaces add considerably to our insight. Most important, perhaps, the notions of 
linear spaces and linear transformations give a geometrical basis to matrix theory, 
which aids both in understanding, as well as in suggesting proofs and new results. 

J. Ortega 

[7] James Ortega, Matrix Theory. A Second Course. Plenum Press, 
1987. 


A economia de pensamento e notação, bem como a riqueza ima¬ 
ginativa que provém do uso da linguagem geométrica resultam do 
emprego judicioso das noções de espaço vetorial e transformação li¬ 
near. Ortega tira grande proveito desse ponto de vista intrínseco 
e consegue escrever um livro que, em meras 250 páginas, faz uma 
revisão dos princípios básicos da Álgebra Linear e desenvolve, com 
notável eficiência, uma exposição sobre tópicos avançados da álgebra 
das matrizes, que pode ser útil tanto para o matemático puro como 
para aqueles que se interessam de modo inteligente pelo cálculo nu¬ 
mérico matricial. 

“Linear Álgebra, like motherhood, has become a sacred cow. It is taught eve- 
rywhere; it is reaching down into the high schools; it is jostling calculus for the 
right to be taught first”. 

I. Kaplansky 

[8] Irving Kaplansky, Linear Álgebra and Geometry. Chelsea, 1969. 

Kaplansky é um consagrado expositor. Na Universidade de Chi¬ 
cago (onde era colega de MacLane e Halmos) suas aulas eram fa¬ 
mosas pela elegância das demonstrações e pelo notável poder de 
síntese. Estas qualidades estão presentes neste livro. Nele, o autor 
oferece uma alternativa para um segundo curso de Álgebra Linear, 
como fundamento básico da Geometria, esta última vista em toda a 
sua generalidade. 
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“As a very simple example the reader should think of the principal axis theo- 
rem (spectral theorem) for TZ n which says that given a self-adjoint transformation, 
one can choose an orthonormal basis in 1Z n so that the matrix of that transforma¬ 
tion in that basis is diagonal. That is, if one chooses the right isomorphic copy of 
TZ n (change of basis) then the operator becomes especially simple. As the reader 
will see, this example is the first note of a rather long simphony”. 

M. Reed e B. Simon 

[9] M. Reed/B. Simon, Methods of Mathematical Physics, vol. I: 
Functional Analysis. (Revised Edition, Academic Press, 1980.) 

Ao mencionar o bem conhecido texto de Reed/Simon, minha in¬ 
tenção é apresentar um livro de Análise Funcional, uma área da Ma¬ 
temática onde tudo se passa dentro de espaços vetoriais. Há muitos 
bons livros sobre este assunto. (Um exemplo à mão é o excelente 
“Operadores Auto-Adjuntos e Equações Diferenciais Parciais”, de 
Javier Thayer, publicado no Projeto Euclides do IMPA.) A escolha de 
Reed/Simon se deve não apenas às suas boas qualidades intrínsecas 
como também ao fato de que exibe a Análise Funcional (portanto os 
espaços vetoriais) como porta de entrada para a Física Matemática. 

Uma palavra sobre pré-requisitos: o livro de Ortega está ao al¬ 
cance imediato de quem leu o presente texto. Kaplansky requer um 
conhecimento elementar de corpos, a nível de um curso introdutório 
de Álgebra. Reed/Simon (ou qualquer outro livro de Análise Fun¬ 
cional) pressupõe noções básicas de Análise, Teoria da Integral e 
Equações Diferenciais. 

[10] Ralph Costa Teixeira, Álgebra Linear, exercícios e soluções. 
(Coleção Matemática Universitária, IMPA, 2009.) 

O livro de Ralph Costa Teixeira contém as soluções dos 594 exer¬ 
cícios propostos no presente texto. Na verdade, o total é bem maior 
do que seiscentos, pois vários desses exercícios são múltiplos. Além 
das soluções, todas completas e elegantemente apresentadas, cada 
capítulo tem início com a revisão dos conceitos a serem tratados, a 
discussão de simples exemplos adicionais e o destaque de algumas 
proposições referentes ao tema estudado. 
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A coleção Matemática Universi¬ 
tária é uma série de livros escritos 
por matemáticos competentes e 
com grande experiência didática, 
a fim de servirem de textos para 
cursos em nível de graduação nas 
universidades brasileiras. 

Os livros da coleção contêm 
exposições objetivas e bem organi¬ 
zadas, acompanhadas de exercí¬ 
cios selecionados. 


0 livro 

E uma introdução à Álgebra Linear, 
escrita para leitores que não 
necessitam possuir conhecimentos 
anteriores sobre o assunto. A 
apresentação busca um equilíbrio 
entre a organização teórica da 
matéria e seus aspectos concretos 
(ou práticos), como a eliminação 
gaussiana, o método de Lagrange 
para diagonalização de formas 
quadráticas ou as várias 
decomposições de matrizes. 

Alguns tópicos, como valores 
singulares, pseudo-inversa, 
equações a diferenças finitas e 
outros, geralmente não discutidos 
em livros elementares como este, 
foram incluídos em vista de sua 
importância nas aplicações e 
também por servirem de atraentes 
ilustrações da teoria. 
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